Title: Testování podobnosti vět
Other Titles: Semantic textual similarity
Authors: Hankovec, Jiří
Advisor: Svoboda Lukáš, Ing.
Referee: Brychcín Tomáš, Ing. Ph.D.
Issue Date: 2017
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/27690
Keywords: zpracování přirozeného jazyka;strojové učení;sémantická podobnost vět;předzpracování textu;lineární regrese
Keywords in different language: nlp;machine learning;sts;text preprocessing;linear regression
Abstract: Cílem této práce je prozkoumat problematiku výpočtu sémantické podobnosti dvou českých vět. V této práci jsou představeny některé metody pro výpočet sémantické podobnosti jednotlivých slov i celých vět. Lidmi ohodnocené původní věty jsou převzaty z dat z mezinárodní soutěže SemEval. Testování sémantické podobnosti vět je prováděno na vytvořeném českém korpusu, který se skládá z 1200 dvojic vět bodově ohodnocených od 0 do 5 na základě jejich sémantické podobnosti. Přesnost vypočtené sémantické podobnosti u testovacích dvojic vět je měřena pomocí Pearsonovy korelace.
Abstract in different language: The goal of this bachelor thesis is to analyze the problematics of Semantic Textual Similarity (STS) and adapt current state-of-the-art methods for Czech language. STS systems are usually compared with manually annotated data. The data comes from international SemEval competition. This thesis reveals methods and evaluation process of STS and consist of dataset with two sentences rated with a score between 0 and 5. Testing is done on manually created dataset of 1200 pair of sentences. System is measured by Pearson's correlation and compared with human annotators.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Bakalářské práce / Bachelor´s works (KIV)

Files in This Item:
File Description SizeFormat 
BP_Hankovec.pdfPlný text práce613,58 kBAdobe PDFView/Open
A12B0058P-hodnoceni.pdfPosudek vedoucího práce384,81 kBAdobe PDFView/Open
A12B0058P-posudek.pdfPosudek oponenta práce525,97 kBAdobe PDFView/Open
A12B0058P-obhajoba.pdfPrůběh obhajoby práce204,32 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/27690

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.