Název: | Pokročilé metody srovnávání sémantiky vět |
Další názvy: | Advanced Methods for Sentence Semantic Similarity |
Autoři: | Ptáček, Tomáš |
Vedoucí práce/školitel: | Habernal, Ivan |
Oponent: | Konopík, Miloslav |
Datum vydání: | 2012 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/3077 |
Klíčová slova: | sémantická podobnost |
Klíčová slova v dalším jazyce: | semantic similarity |
Abstrakt: | Tato práce se zaměřuje na problematiku sémantické podobnosti vět v anglickém jazyce. Popisuje předzpracování dokumentů, modely vyhledávání informací, sémantické metody pro získávání informací a metody výpočtu sémantické podobnosti mezi slovy. Bylo vybráno pět slibných metod a ověřena jejich úspěšnost. V praktické části je navrženo šest nových metod pro podobnost vět založených na existujících tzv. state-of-the-art metodách popsaných v teoretické části. Je vyhodnoceno celkem jedenáct metod větné podobnosti. Hodnocení se provádí na dvou různých datových sadách, konkrétně Microsoft Research Parphrase Corpus a Semantic Textual Similarity Shared Task. Získané výsledky jsou kriticky hodnoceny v závěru práce. |
Abstrakt v dalším jazyce: | This thesis is focused on the problem of sentence semantic similarity in English language. The theory for document preprocessing, information retrieval models, semantic methods in information retrieval, semantic similarity between words and sentence similarity measures are introduced in the theoretical part. We selected and implemented five promising sentence similarity measures. In the practical part we propose six new sentence similarity measures inspired by state-of-the-art measures described in the theoretical part. We evaluate eleven sentence similarity measures. The evaluation is conducted on two different data sets. The data sets are the Microsoft Research paraphrase corpus and the Semantic Textual Similarity shared task. At the end of the thesis the results are discussed. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Thesis.pdf | Plný text práce | 4,86 MB | Adobe PDF | Zobrazit/otevřít |
A10N0100Pposudek-ved.pdf | Posudek vedoucího práce | 325,12 kB | Adobe PDF | Zobrazit/otevřít |
A10N0100Pposudek-op.pdf | Posudek oponenta práce | 508,07 kB | Adobe PDF | Zobrazit/otevřít |
A10N0100Pprubeh.pdf | Průběh obhajoby práce | 166,64 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/3077
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.