Title: Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat
Other Titles: Optimal data-mining techniques for semi-structured medical data processing
Authors: Kamburov, Mario
Advisor: Klečková Jana, Doc. Dr. Ing.
Referee: Včelák Petr, Ing.
Issue Date: 2016
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/23700
Keywords: dolování znalostí;fulltext;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínská data;semistrukturovaná data;weka;couchdb
Keywords in different language: datamining;fulltext;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka;lucene;couchdb
Abstract: Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování několik dataminingových algoritmů pro klasifikaci textů. Je zde popsán princip mnou navrženého řešení, které využívá databázi pro ukládání trénovacích dat. V práci využívám fulltextové vyhledávání pro účely navrhování oprav zkratek a celkovou korekci lékařských textů, založenou na CouchDB a Apache Lucene. Pro vylepšené hledání oprav medicínského textu jsem používal metody dataminingu. Závěr obsahuje celkové hodnocení úspěšnosti datamining algoritmů a fulltextových databází.
Abstract in different language: The aim of my thesis was to propose a solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of several datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. In my thesis I am using fulltext search based on CouchDB and Apache Lucene for the purpose of medical spell check and text correction. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
DP_Kamburov.pdfPlný text práce2,66 MBAdobe PDFView/Open
A13N0064Pposudek-op.PDFPosudek oponenta práce833,25 kBAdobe PDFView/Open
A13N0064Phodnoceni-ved.PDFPosudek vedoucího práce398,37 kBAdobe PDFView/Open
A13N0064Pobhajoba.PDFPrůběh obhajoby práce204,1 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/23700

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.