Title: | Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat |
Other Titles: | Optimal data-mining techniques for semi-structured medical data processing |
Authors: | Kamburov, Mario |
Advisor: | Klečková Jana, Doc. Dr. Ing. |
Referee: | Včelák Petr, Ing. |
Issue Date: | 2016 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | diplomová práce |
URI: | http://hdl.handle.net/11025/23654 |
Keywords: | dolování znalostí;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínské data;semistrukturovaná data;weka |
Keywords in different language: | datamining;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka |
Abstract: | Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování přirozeného jazyka a několik již implementovaných datamining algoritmů pro klasifikace textů. Je zde popsán princip mnou navrženého řešení, který využívá databáze pro ukládání trénovacích dat. Dále je podrobně popsána implementace v jazyce Java s napojením na databázi MySQL, PostgreSQL a IBM DB2 a provedeno ověření na vybrané kolekci medicínských dat. Na konci jsou pak předloženy obsáhlé statistiky průběhu zpracování a porovnávání získaných výsledků. Závěr obsahuje celkové hodnocení práce s doporučením možných budoucích vylepšení. |
Abstract in different language: | The aim of my thesis was to propose solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of natural language processing, and several already implemented datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. The implementation of Java program is also described in detail using MySQL, PostgreSQL, and IBM DB2 databases. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Diplomové práce / Theses (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
DP.pdf | Plný text práce | 1,25 MB | Adobe PDF | View/Open |
A13N0064Pposudek-op.PDF | Posudek oponenta práce | 1,71 MB | Adobe PDF | View/Open |
A13N0064Phodnoceni-ved.PDF | Posudek vedoucího práce | 402,61 kB | Adobe PDF | View/Open |
A13N0064Pobhajoba.PDF | Průběh obhajoby práce | 224,19 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/23654
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.