Název: Možnosti analytického rozšíření úložiště Data Lakehouse
Další názvy: Data Lakehouse analytical extension options
Autoři: Bozděch, Josef
Vedoucí práce/školitel: Klečková Jana, Doc. Dr. Ing.
Oponent: Kryl Martin, Ing.
Datum vydání: 2024
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/57246
Klíčová slova: delta lake;apache spark;vizualizace a statistika;datová analýza;preact;zpracování informací;data lakehouse
Klíčová slova v dalším jazyce: delta lake;apache spark;visualization a statistics;data analysis;preact;information processing;data lakehouse
Abstrakt: V diplomové práci jsou diskutovány analytické a statistické možnosti rozšíření datového úložiště Data Lakehouse. Nejdříve je zkoumán koncept úložiště data lakehouse, následně jsou popsány již existující implementace tohoto úložiště - Databricks a koncept Data Lakehouse, na který je v této práci navazováno. Následně jsou zkoumána dostupná data pro Data Lakehouse z platformy MRE ZČU zabývající se shromažďováním medicínských dat. Následně jsou navrhnuty možnosti rozšíření Data Lakehouse, následuje popis jejich implementace, výběr technologií a problémy, na které bylo narazeno při implementaci těchto návrhů. Nakonec je implementace otestována, výsledek práce porovnán s MRE, navrženy další možnosti rozšíření Data Lakehouse, shrnuty a vyhodnoceny dosažené výsledky.
Abstrakt v dalším jazyce: The thesis discusses the analytical and statistical possibilities of extending the Data Lakehouse data warehouse. First, the concept of Data Lakehouse is examined, then existing implementations of this repository - Databricks and the Data Lakehouse concept, which is built upon in this thesis, are described. Subsequently, the available data for Data Lakehouse from the MRE platform of ZČU dealing with medical data collection is examined. Subsequently, options for extending the Data Lakehouse are proposed, followed by a description of their implementation, technology selection and the problems encountered in implementing these proposals. Finally, the implementation is tested, the result of the work is compared with the MRE, further options for extending the Data Lakehouse are proposed, and the results are summarized and evaluated.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_Bozdech_Josef_2024.pdfPlný text práce1,04 MBAdobe PDFZobrazit/otevřít
A22N0039Phodnoceni-ved.pdfPosudek vedoucího práce412,72 kBAdobe PDFZobrazit/otevřít
A22N0039Pposudek-op.pdfPosudek oponenta práce568,53 kBAdobe PDFZobrazit/otevřít
A22N0039Pobhajoba.pdfPrůběh obhajoby práce192,72 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/57246

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.