Title: | Automatická extrakce klíčových slov pomocí metod trénovaných bez učitele |
Other Titles: | Unsupervised methods for automatic keyword extraction |
Authors: | Zíbar, Karel |
Advisor: | Brychcín Tomáš, Ing. Ph.D. |
Referee: | Hercig Tomáš, Ing. |
Issue Date: | 2017 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | diplomová práce |
URI: | http://hdl.handle.net/11025/27152 |
Keywords: | metody extrakce klíčových slov trénované bez učitele;tf-idf;lda;glove;semeval 2010 |
Keywords in different language: | unsupervised keyword extraction methods;tf-idf;lda;glove;semeval 2010 |
Abstract: | Tato práce se zabývá různými přístupy extrahování klíčových slov z textových dokumentů. Celkem byly implementovány tři dobře známé metody - TF-IDF, LDA a GloVe (extrakce pomocí reprezentace slov vektory GloVe). Jejich algoritmy byly lehce upraveny tak, aby metody mohly využívat více příznaků než před tím. Byla také navržena vlastní metoda (označena jako ZKEM) kombinující všechny výše zmíněné přístupy a otestována stejným způsobem. Všechny tyto metody byly testovány a srovnány s metodami, účastnících se mezinárodní programovací soutěže SemEval 2010. Nejlepší metoda (vylepšená metoda TF-IDF) dosáhla úspěšnosti 25,95 %. Tento výsledek by stačil na druhé místo v soutěži SemEval. |
Abstract in different language: | This thesis deals with different approaches to keyword extraction from text documents. Three well-known methods have been implemented - TF-IDF, LDA and GloVe (keyword extraction by representing words as GloVe's vectors). Their algorithms have been slightly improved so that the methods can use more features. Finally, a new method (denoted as ZKEM), combining all three approaches mentioned above, has been created and properly evaluated in the same way as the others. All methods have been tested and compared with the algorithms participated at international programming competition SemEval 2010. The best method (improved TF-IDF) has achieved 25.95% accuracy. This result would be enough to take second place at SemEval competition. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Diplomové práce / Theses (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
zibar_unsupervised-methods-for-automatic-keyword-extraction_2017.pdf | Plný text práce | 5,48 MB | Adobe PDF | View/Open |
A14N0151Phodnoceni-ved.PDF | Posudek vedoucího práce | 436,44 kB | Adobe PDF | View/Open |
A14N0151Pposudek-op.PDF | Posudek oponenta práce | 379,82 kB | Adobe PDF | View/Open |
A14N0151Pobhajoba.PDF | Průběh obhajoby práce | 203,7 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/27152
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.