Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat

Kamburov, Mario

Název:	Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat
Další názvy:	Optimal data-mining techniques for semi-structured medical data processing
Autoři:	Kamburov, Mario
Vedoucí práce/školitel:	Klečková Jana, Doc. Dr. Ing.
Oponent:	Včelák Petr, Ing.
Datum vydání:	2016
Nakladatel:	Západočeská univerzita v Plzni
Typ dokumentu:	diplomová práce
URI:	http://hdl.handle.net/11025/23654
Klíčová slova:	dolování znalostí;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínské data;semistrukturovaná data;weka
Klíčová slova v dalším jazyce:	datamining;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka
Abstrakt:	Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování přirozeného jazyka a několik již implementovaných datamining algoritmů pro klasifikace textů. Je zde popsán princip mnou navrženého řešení, který využívá databáze pro ukládání trénovacích dat. Dále je podrobně popsána implementace v jazyce Java s napojením na databázi MySQL, PostgreSQL a IBM DB2 a provedeno ověření na vybrané kolekci medicínských dat. Na konci jsou pak předloženy obsáhlé statistiky průběhu zpracování a porovnávání získaných výsledků. Závěr obsahuje celkové hodnocení práce s doporučením možných budoucích vylepšení.
Abstrakt v dalším jazyce:	The aim of my thesis was to propose solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of natural language processing, and several already implemented datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. The implementation of Java program is also described in detail using MySQL, PostgreSQL, and IBM DB2 databases. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.
Práva:	Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:	Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
DP.pdf	Plný text práce	1,25 MB	Adobe PDF	Zobrazit/otevřít
A13N0064Pposudek-op.PDF	Posudek oponenta práce	1,71 MB	Adobe PDF	Zobrazit/otevřít
A13N0064Phodnoceni-ved.PDF	Posudek vedoucího práce	402,61 kB	Adobe PDF	Zobrazit/otevřít
A13N0064Pobhajoba.PDF	Průběh obhajoby práce	224,19 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23654

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace