Explicitní sémantická analýza

Tušl, Michal

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.advisor	Brychcín Tomáš, Ing. Ph.D.
dc.contributor.author	Tušl, Michal
dc.contributor.referee	Svoboda Lukáš, Ing.
dc.date.accepted	2017-6-8
dc.date.accessioned	2018-01-15T15:04:41Z	-
dc.date.available	2016-10-10
dc.date.available	2018-01-15T15:04:41Z	-
dc.date.issued	2017
dc.date.submitted	2017-5-4
dc.identifier	72174
dc.identifier.uri	http://hdl.handle.net/11025/27718
dc.description.abstract	Tato práce je zaměřena na sémantickou analýzu textů. Konkrétně na metody Explicitní sémantická analýza a Latentní sémantická analýza. Tyto metody jsou založené na trénování bez učitele a jako trénovací data využívají Wikipedii. Na výsledek metod je aplikován singulární rozklad matic, který redukuje paměťové nároky a zároveň vylepšuje výsledky metod. Testování výsledků je prováděno na standardních datasetech pro anglický a český jazyk. Tyto datasety obsahují páry slov a manuálně definovanou sémantickou podobnost. Kvalita sémantické reprezentace je měrena pomocí Pearsonovy a Spearmanovy korelace. Všechny testované metody dosahují na obou jazycích velmi dobrých výsledků.	cs
dc.format	36 s.	cs
dc.format.mimetype	application/pdf
dc.language.iso	cs	cs
dc.publisher	Západočeská univerzita v Plzni	cs
dc.rights	Plný text práce je přístupný bez omezení.	cs
dc.subject	zpracování přirozeného jazyka	cs
dc.subject	distribuční sémantika	cs
dc.subject	sémantická podobnost	cs
dc.subject	vektorové sémantické prostory	cs
dc.subject	explicitní sémantická analýza	cs
dc.subject	latentní sémantická analýza	cs
dc.subject	singulární rozklad	cs
dc.title	Explicitní sémantická analýza	cs
dc.title.alternative	Explicit semantic analysis	en
dc.type	bakalářská práce	cs
dc.thesis.degree-name	Bc.	cs
dc.thesis.degree-level	Bakalářský	cs
dc.thesis.degree-grantor	Západočeská univerzita v Plzni. Fakulta aplikovaných věd	cs
dc.thesis.degree-program	Inženýrská informatika	cs
dc.description.result	Obhájeno	cs
dc.rights.access	openAccess	en
dc.description.abstract-translated	This bachelor thesis investigates semantic analysis of texts in natural language. It focuses on Explicit Semantic Analysis and Latent Semantic Analysis methods. These methods are based on unsupervised machine learning and use Wikipedia as a training data. Singular Value Decomposition is used to reduce the memory requirements and also to improve the results. Standard English and Czech datasets are used for testing purposes. These datasets contain word pairs and manually annotated semantic similarity. The quality of semantic representation is evaluated by Pearson and Spearman correlation. All tested methods provide very promising results on both languages.	en
dc.subject.translated	nlp	en
dc.subject.translated	distributional semantics	en
dc.subject.translated	semantic similarity	en
dc.subject.translated	vector space model	en
dc.subject.translated	explicit semantic analysis	en
dc.subject.translated	latent semantic analysis	en
dc.subject.translated	singular value decomposition	en
Vyskytuje se v kolekcích:	Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
BP_Tusl_A14B0453P.pdf	Plný text práce	516,22 kB	Adobe PDF	Zobrazit/otevřít
A14B0453P-hodnoceni.pdf	Posudek vedoucího práce	235,16 kB	Adobe PDF	Zobrazit/otevřít
A14B0453P-posudek.pdf	Posudek oponenta práce	412,13 kB	Adobe PDF	Zobrazit/otevřít
A14B0453P-obhajoba.pdf	Průběh obhajoby práce	185,69 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/27718

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace