Title: | Explicitní sémantická analýza |
Other Titles: | Explicit semantic analysis |
Authors: | Tušl, Michal |
Advisor: | Brychcín Tomáš, Ing. Ph.D. |
Referee: | Svoboda Lukáš, Ing. |
Issue Date: | 2017 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | bakalářská práce |
URI: | http://hdl.handle.net/11025/27718 |
Keywords: | zpracování přirozeného jazyka;distribuční sémantika;sémantická podobnost;vektorové sémantické prostory;explicitní sémantická analýza;latentní sémantická analýza;singulární rozklad |
Keywords in different language: | nlp;distributional semantics;semantic similarity;vector space model;explicit semantic analysis;latent semantic analysis;singular value decomposition |
Abstract: | Tato práce je zaměřena na sémantickou analýzu textů. Konkrétně na metody Explicitní sémantická analýza a Latentní sémantická analýza. Tyto metody jsou založené na trénování bez učitele a jako trénovací data využívají Wikipedii. Na výsledek metod je aplikován singulární rozklad matic, který redukuje paměťové nároky a zároveň vylepšuje výsledky metod. Testování výsledků je prováděno na standardních datasetech pro anglický a český jazyk. Tyto datasety obsahují páry slov a manuálně definovanou sémantickou podobnost. Kvalita sémantické reprezentace je měrena pomocí Pearsonovy a Spearmanovy korelace. Všechny testované metody dosahují na obou jazycích velmi dobrých výsledků. |
Abstract in different language: | This bachelor thesis investigates semantic analysis of texts in natural language. It focuses on Explicit Semantic Analysis and Latent Semantic Analysis methods. These methods are based on unsupervised machine learning and use Wikipedia as a training data. Singular Value Decomposition is used to reduce the memory requirements and also to improve the results. Standard English and Czech datasets are used for testing purposes. These datasets contain word pairs and manually annotated semantic similarity. The quality of semantic representation is evaluated by Pearson and Spearman correlation. All tested methods provide very promising results on both languages. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Bakalářské práce / Bachelor´s works (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
BP_Tusl_A14B0453P.pdf | Plný text práce | 516,22 kB | Adobe PDF | View/Open |
A14B0453P-hodnoceni.pdf | Posudek vedoucího práce | 235,16 kB | Adobe PDF | View/Open |
A14B0453P-posudek.pdf | Posudek oponenta práce | 412,13 kB | Adobe PDF | View/Open |
A14B0453P-obhajoba.pdf | Průběh obhajoby práce | 185,69 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/27718
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.