Title: Koncept Data Lakehouse pro zpracování medicínských dat
Other Titles: Data Lakehouse concept for medical data processing
Authors: Moučka, Lukáš
Advisor: Klečková Jana, Doc. Dr. Ing.
Referee: Kryl Martin, Ing.
Issue Date: 2023
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/53730
Keywords: medicínská data;koncept úložiště;data lakehouse;delta lake;mre platforma;dasta;res-q;dicom;hl7;etl;elt;fair data
Keywords in different language: medical data;the concept of storage;data lakehouse;delta lake;medical research and education platform;dasta;res-q;dicom;hl7;etl;elt;fair data
Abstract: Diplomová práce se zabývá problematikou nového typu úložiště Data Lakehouse, které je koncipováno pro ukládání heterogenních dat. V teoretické části je zmíněna evoluce jednotlivých typů úložišť a zevrubně je popisuje. Hlavním cílem je ukládat medicínské záznamy do tohoto typu úložiště a následně s nimi pracovat. Toto aktuálně řeší MRE platforma, která je vyvíjena a provozována na FAV ZČU. Pro ověření vhodnosti úložiště pro oblast medicínských dat byla vyvinuta aplikace, která implementuje úložiště Data Lakehouse za pomocí open-source projektu Delta Lake. První část aplikace tvoří administrace, která poskytuje kompletní správu uživatelů a obsahuje sekce zajišťující správu úložiště. Druhou část tvoří úložiště a skrze REST API poskytuje veškeré funkce pro jeho správu. Výsledné testování aplikace ukazuje vhodnost použití úložiště pro medicínská data. Na základě testování jsou popsány i náměty pro případná zlepšení a rozšíření stávající práce.
Abstract in different language: The master thesis deals with a new type of Data Lakehouse, which is designed for heterogeneous data storage. In the theoretical part, it deals with the evolution of different types of storage and describes them in detail. The main goal is to store medical records in this type of storage and then work with them. This is currently solved by the MRE platform, which is developed and operated at the FAV ZČU. To verify the suitability of the storage for the medical data area, an application was developed that implements the Data Lakehouse using the open-source Delta Lake project. The first part of the application consists of the administration, which provides complete user management and contains sections to ensure the management of the repository. The second part consists of the storage and provides all the functionality for its management through a REST API. The final testing of the application shows the suitability of using the storage for medical data. Based on the testing, suggestions for possible improvements and extensions to existing work are also described.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
DP_Moucka_Lukas_2023.pdfPlný text práce2,03 MBAdobe PDFView/Open
A20N0053Pposudek-op.pdfPosudek oponenta práce423,97 kBAdobe PDFView/Open
A20N0053Phodnoceni-ved.pdfPosudek vedoucího práce542,57 kBAdobe PDFView/Open
A20N0053Pobhajoba.pdfPrůběh obhajoby práce534,28 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/53730

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.