Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.advisor | Svoboda Lukáš, Ing. | |
dc.contributor.author | Hankovec, Jiří | |
dc.contributor.referee | Brychcín Tomáš, Ing. Ph.D. | |
dc.date.accepted | 2017-8-29 | |
dc.date.accessioned | 2018-01-15T15:04:42Z | - |
dc.date.available | 2016-10-10 | |
dc.date.available | 2018-01-15T15:04:42Z | - |
dc.date.issued | 2017 | |
dc.date.submitted | 2017-6-29 | |
dc.identifier | 70681 | |
dc.identifier.uri | http://hdl.handle.net/11025/27690 | |
dc.description.abstract | Cílem této práce je prozkoumat problematiku výpočtu sémantické podobnosti dvou českých vět. V této práci jsou představeny některé metody pro výpočet sémantické podobnosti jednotlivých slov i celých vět. Lidmi ohodnocené původní věty jsou převzaty z dat z mezinárodní soutěže SemEval. Testování sémantické podobnosti vět je prováděno na vytvořeném českém korpusu, který se skládá z 1200 dvojic vět bodově ohodnocených od 0 do 5 na základě jejich sémantické podobnosti. Přesnost vypočtené sémantické podobnosti u testovacích dvojic vět je měřena pomocí Pearsonovy korelace. | cs |
dc.format | 49 s. | cs |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | cs |
dc.publisher | Západočeská univerzita v Plzni | cs |
dc.rights | Plný text práce je přístupný bez omezení. | cs |
dc.subject | zpracování přirozeného jazyka | cs |
dc.subject | strojové učení | cs |
dc.subject | sémantická podobnost vět | cs |
dc.subject | předzpracování textu | cs |
dc.subject | lineární regrese | cs |
dc.title | Testování podobnosti vět | cs |
dc.title.alternative | Semantic textual similarity | en |
dc.type | bakalářská práce | cs |
dc.thesis.degree-name | Bc. | cs |
dc.thesis.degree-level | Bakalářský | cs |
dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
dc.thesis.degree-program | Inženýrská informatika | cs |
dc.description.result | Obhájeno | cs |
dc.rights.access | openAccess | en |
dc.description.abstract-translated | The goal of this bachelor thesis is to analyze the problematics of Semantic Textual Similarity (STS) and adapt current state-of-the-art methods for Czech language. STS systems are usually compared with manually annotated data. The data comes from international SemEval competition. This thesis reveals methods and evaluation process of STS and consist of dataset with two sentences rated with a score between 0 and 5. Testing is done on manually created dataset of 1200 pair of sentences. System is measured by Pearson's correlation and compared with human annotators. | en |
dc.subject.translated | nlp | en |
dc.subject.translated | machine learning | en |
dc.subject.translated | sts | en |
dc.subject.translated | text preprocessing | en |
dc.subject.translated | linear regression | en |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
BP_Hankovec.pdf | Plný text práce | 613,58 kB | Adobe PDF | Zobrazit/otevřít |
A12B0058P-hodnoceni.pdf | Posudek vedoucího práce | 384,81 kB | Adobe PDF | Zobrazit/otevřít |
A12B0058P-posudek.pdf | Posudek oponenta práce | 525,97 kB | Adobe PDF | Zobrazit/otevřít |
A12B0058P-obhajoba.pdf | Průběh obhajoby práce | 204,32 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/27690
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.