Název: Pokročilé metody srovnávání sémantiky vět
Další názvy: Advanced Methods for Sentence Semantic Similarity
Autoři: Ptáček, Tomáš
Vedoucí práce/školitel: Habernal, Ivan
Oponent: Konopík, Miloslav
Datum vydání: 2012
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/3077
Klíčová slova: sémantická podobnost
Klíčová slova v dalším jazyce: semantic similarity
Abstrakt: Tato práce se zaměřuje na problematiku sémantické podobnosti vět v anglickém jazyce. Popisuje předzpracování dokumentů, modely vyhledávání informací, sémantické metody pro získávání informací a metody výpočtu sémantické podobnosti mezi slovy. Bylo vybráno pět slibných metod a ověřena jejich úspěšnost. V praktické části je navrženo šest nových metod pro podobnost vět založených na existujících tzv. state-of-the-art metodách popsaných v teoretické části. Je vyhodnoceno celkem jedenáct metod větné podobnosti. Hodnocení se provádí na dvou různých datových sadách, konkrétně Microsoft Research Parphrase Corpus a Semantic Textual Similarity Shared Task. Získané výsledky jsou kriticky hodnoceny v závěru práce.
Abstrakt v dalším jazyce: This thesis is focused on the problem of sentence semantic similarity in English language. The theory for document preprocessing, information retrieval models, semantic methods in information retrieval, semantic similarity between words and sentence similarity measures are introduced in the theoretical part. We selected and implemented five promising sentence similarity measures. In the practical part we propose six new sentence similarity measures inspired by state-of-the-art measures described in the theoretical part. We evaluate eleven sentence similarity measures. The evaluation is conducted on two different data sets. The data sets are the Microsoft Research paraphrase corpus and the Semantic Textual Similarity shared task. At the end of the thesis the results are discussed.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Diplomové práce (KIV) / Theses (DCE)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Thesis.pdfPlný text práce4,86 MBAdobe PDFZobrazit/otevřít
A10N0100Pposudek-ved.pdfPosudek vedoucího práce325,12 kBAdobe PDFZobrazit/otevřít
A10N0100Pposudek-op.pdfPosudek oponenta práce508,07 kBAdobe PDFZobrazit/otevřít
A10N0100Pprubeh.pdfPrůběh obhajoby práce166,64 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/3077

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.