Testování podobnosti vět

Hankovec, Jiří

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.advisor	Svoboda Lukáš, Ing.
dc.contributor.author	Hankovec, Jiří
dc.contributor.referee	Brychcín Tomáš, Ing. Ph.D.
dc.date.accepted	2017-8-29
dc.date.accessioned	2018-01-15T15:04:42Z	-
dc.date.available	2016-10-10
dc.date.available	2018-01-15T15:04:42Z	-
dc.date.issued	2017
dc.date.submitted	2017-6-29
dc.identifier	70681
dc.identifier.uri	http://hdl.handle.net/11025/27690
dc.description.abstract	Cílem této práce je prozkoumat problematiku výpočtu sémantické podobnosti dvou českých vět. V této práci jsou představeny některé metody pro výpočet sémantické podobnosti jednotlivých slov i celých vět. Lidmi ohodnocené původní věty jsou převzaty z dat z mezinárodní soutěže SemEval. Testování sémantické podobnosti vět je prováděno na vytvořeném českém korpusu, který se skládá z 1200 dvojic vět bodově ohodnocených od 0 do 5 na základě jejich sémantické podobnosti. Přesnost vypočtené sémantické podobnosti u testovacích dvojic vět je měřena pomocí Pearsonovy korelace.	cs
dc.format	49 s.	cs
dc.format.mimetype	application/pdf
dc.language.iso	cs	cs
dc.publisher	Západočeská univerzita v Plzni	cs
dc.rights	Plný text práce je přístupný bez omezení.	cs
dc.subject	zpracování přirozeného jazyka	cs
dc.subject	strojové učení	cs
dc.subject	sémantická podobnost vět	cs
dc.subject	předzpracování textu	cs
dc.subject	lineární regrese	cs
dc.title	Testování podobnosti vět	cs
dc.title.alternative	Semantic textual similarity	en
dc.type	bakalářská práce	cs
dc.thesis.degree-name	Bc.	cs
dc.thesis.degree-level	Bakalářský	cs
dc.thesis.degree-grantor	Západočeská univerzita v Plzni. Fakulta aplikovaných věd	cs
dc.thesis.degree-program	Inženýrská informatika	cs
dc.description.result	Obhájeno	cs
dc.rights.access	openAccess	en
dc.description.abstract-translated	The goal of this bachelor thesis is to analyze the problematics of Semantic Textual Similarity (STS) and adapt current state-of-the-art methods for Czech language. STS systems are usually compared with manually annotated data. The data comes from international SemEval competition. This thesis reveals methods and evaluation process of STS and consist of dataset with two sentences rated with a score between 0 and 5. Testing is done on manually created dataset of 1200 pair of sentences. System is measured by Pearson's correlation and compared with human annotators.	en
dc.subject.translated	nlp	en
dc.subject.translated	machine learning	en
dc.subject.translated	sts	en
dc.subject.translated	text preprocessing	en
dc.subject.translated	linear regression	en
Vyskytuje se v kolekcích:	Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
BP_Hankovec.pdf	Plný text práce	613,58 kB	Adobe PDF	Zobrazit/otevřít
A12B0058P-hodnoceni.pdf	Posudek vedoucího práce	384,81 kB	Adobe PDF	Zobrazit/otevřít
A12B0058P-posudek.pdf	Posudek oponenta práce	525,97 kB	Adobe PDF	Zobrazit/otevřít
A12B0058P-obhajoba.pdf	Průběh obhajoby práce	204,32 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/27690

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace