Title (eng)
Enhancing healthcare data processing
leveraging Hadoop and Hive for querying big data in data warehousing solutions
Author
Tobias Fühles
Advisor
Peter Reichl
Assessor
Peter Reichl
Abstract (deu)
Die kontinuierlichen Entwicklungen in den Bereichen Interoperabilität, Cloud Computing und Hardwareentwicklung haben die Menge der generierten und verarbeiteten Daten in vielen Branchen erhöht, so auch im Gesundheitswesen. Historisch gewachsene relationale Datenbanken bieten die Möglichkeit strategische Entscheidungen und patientenorientierte Analysen im Gesundheitswesen zu unterstützen. Da eine Implementierung solcher Optimierungen allerdings stark von der Effizienz und Geschwindigkeit der benötigten Datenabfragen abhängt, stoßen relationale Datenbanken abhängig von Hardware, Datenvolumen und Datenkomplexität an ihre Grenzen. Diese Arbeit untersucht die verbesserten Analysemöglichkeiten durch die zusätzliche Implementierung einer auf Hadoop basierenden Datenbank, neben bestehenden relationalen Datenbanklösungen. Für einen aussagekräftigen Vergleich werden beide Datenbanklösungen mit Hilfe des Benchmarking Tools TPC-DS innerhalb der Cloud Computing Platform Azure verglichen und die Ergebnisse hinsichtlich Möglichkeiten und Hindernissen für Institutionen des Gesundheitswoverleaf.com/project/6522a2103dc1cba6a9e14e8d#esen kritisch evaluiert sowie Empfehlungen für mögliche Implementierungen gegeben.
Abstract (eng)
Continuous developments in interoperability, cloud computing and hardware development have increased the amount of data generated and processed in many industries, including healthcare. Historically grown relational databases offer the possibility of supporting strategic decisions and patient-oriented analyses in the healthcare sector. However, since the implementation of such optimizations depends heavily on the efficiency and speed of the required data queries, relational databases reach their limits depending on hardware, data volume and data complexity. This work examines the improved analysis possibilities through the additional implementation of a Hadoop-based database alongside existing relational database solutions. For a meaningful comparison, both database solutions are compared using the benchmarking tool TPC-DS within the cloud computing platform Azure and the results are critically evaluated in terms of opportunities and obstacles for healthcare institutions and recommendations for possible implementations are given.
Keywords (deu)
HadoopHealthCareRDBMS
Subject (deu)
Type (deu)
Persistent identifier
Extent (deu)
ix, 70 Seiten : Illustrationen
Number of pages
82
Study plan
Masterstudium Wirtschaftsinformatik
[UA]
[066]
[926]
Association (deu)
Title (eng)
Enhancing healthcare data processing
leveraging Hadoop and Hive for querying big data in data warehousing solutions
Author
Tobias Fühles
Abstract (deu)
Die kontinuierlichen Entwicklungen in den Bereichen Interoperabilität, Cloud Computing und Hardwareentwicklung haben die Menge der generierten und verarbeiteten Daten in vielen Branchen erhöht, so auch im Gesundheitswesen. Historisch gewachsene relationale Datenbanken bieten die Möglichkeit strategische Entscheidungen und patientenorientierte Analysen im Gesundheitswesen zu unterstützen. Da eine Implementierung solcher Optimierungen allerdings stark von der Effizienz und Geschwindigkeit der benötigten Datenabfragen abhängt, stoßen relationale Datenbanken abhängig von Hardware, Datenvolumen und Datenkomplexität an ihre Grenzen. Diese Arbeit untersucht die verbesserten Analysemöglichkeiten durch die zusätzliche Implementierung einer auf Hadoop basierenden Datenbank, neben bestehenden relationalen Datenbanklösungen. Für einen aussagekräftigen Vergleich werden beide Datenbanklösungen mit Hilfe des Benchmarking Tools TPC-DS innerhalb der Cloud Computing Platform Azure verglichen und die Ergebnisse hinsichtlich Möglichkeiten und Hindernissen für Institutionen des Gesundheitswoverleaf.com/project/6522a2103dc1cba6a9e14e8d#esen kritisch evaluiert sowie Empfehlungen für mögliche Implementierungen gegeben.
Abstract (eng)
Continuous developments in interoperability, cloud computing and hardware development have increased the amount of data generated and processed in many industries, including healthcare. Historically grown relational databases offer the possibility of supporting strategic decisions and patient-oriented analyses in the healthcare sector. However, since the implementation of such optimizations depends heavily on the efficiency and speed of the required data queries, relational databases reach their limits depending on hardware, data volume and data complexity. This work examines the improved analysis possibilities through the additional implementation of a Hadoop-based database alongside existing relational database solutions. For a meaningful comparison, both database solutions are compared using the benchmarking tool TPC-DS within the cloud computing platform Azure and the results are critically evaluated in terms of opportunities and obstacles for healthcare institutions and recommendations for possible implementations are given.
Keywords (deu)
HadoopHealthCareRDBMS
Subject (deu)
Type (deu)
Persistent identifier
Number of pages
82
Association (deu)
License
- Citable links
- Other links
- Managed by
- DetailsObject typeContainerCreated06.05.2024 09:20:04 UTC
- Usage statistics-
- Metadata
- Export formats
