Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorKlečková Jana, Doc. Dr. Ing.
dc.contributor.authorBozděch, Josef
dc.contributor.refereeKryl Martin, Ing.
dc.date.accepted2024-6-17
dc.date.accessioned2024-07-12T09:14:34Z-
dc.date.available2023-9-8
dc.date.available2024-07-12T09:14:34Z-
dc.date.issued2024
dc.date.submitted2024-5-15
dc.identifier96892
dc.identifier.urihttp://hdl.handle.net/11025/57246-
dc.description.abstractV diplomové práci jsou diskutovány analytické a statistické možnosti rozšíření datového úložiště Data Lakehouse. Nejdříve je zkoumán koncept úložiště data lakehouse, následně jsou popsány již existující implementace tohoto úložiště - Databricks a koncept Data Lakehouse, na který je v této práci navazováno. Následně jsou zkoumána dostupná data pro Data Lakehouse z platformy MRE ZČU zabývající se shromažďováním medicínských dat. Následně jsou navrhnuty možnosti rozšíření Data Lakehouse, následuje popis jejich implementace, výběr technologií a problémy, na které bylo narazeno při implementaci těchto návrhů. Nakonec je implementace otestována, výsledek práce porovnán s MRE, navrženy další možnosti rozšíření Data Lakehouse, shrnuty a vyhodnoceny dosažené výsledky.cs
dc.format73 s.
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectdelta lakecs
dc.subjectapache sparkcs
dc.subjectvizualizace a statistikacs
dc.subjectdatová analýzacs
dc.subjectpreactcs
dc.subjectzpracování informacícs
dc.subjectdata lakehousecs
dc.titleMožnosti analytického rozšíření úložiště Data Lakehousecs
dc.title.alternativeData Lakehouse analytical extension optionsen
dc.typediplomová práce
dc.thesis.degree-nameIng.
dc.thesis.degree-levelNavazující
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-programSoftwarové a informační systémy
dc.description.resultObhájeno
dc.description.abstract-translatedThe thesis discusses the analytical and statistical possibilities of extending the Data Lakehouse data warehouse. First, the concept of Data Lakehouse is examined, then existing implementations of this repository - Databricks and the Data Lakehouse concept, which is built upon in this thesis, are described. Subsequently, the available data for Data Lakehouse from the MRE platform of ZČU dealing with medical data collection is examined. Subsequently, options for extending the Data Lakehouse are proposed, followed by a description of their implementation, technology selection and the problems encountered in implementing these proposals. Finally, the implementation is tested, the result of the work is compared with the MRE, further options for extending the Data Lakehouse are proposed, and the results are summarized and evaluated.en
dc.subject.translateddelta lakeen
dc.subject.translatedapache sparken
dc.subject.translatedvisualization a statisticsen
dc.subject.translateddata analysisen
dc.subject.translatedpreacten
dc.subject.translatedinformation processingen
dc.subject.translateddata lakehouseen
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_Bozdech_Josef_2024.pdfPlný text práce1,04 MBAdobe PDFZobrazit/otevřít
A22N0039Phodnoceni-ved.pdfPosudek vedoucího práce412,72 kBAdobe PDFZobrazit/otevřít
A22N0039Pposudek-op.pdfPosudek oponenta práce568,53 kBAdobe PDFZobrazit/otevřít
A22N0039Pobhajoba.pdfPrůběh obhajoby práce192,72 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/57246

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.