Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorBrychcín Tomáš, Ing. Ph.D.
dc.contributor.authorTušl, Michal
dc.contributor.refereeSvoboda Lukáš, Ing.
dc.date.accepted2017-6-8
dc.date.accessioned2018-01-15T15:04:41Z-
dc.date.available2016-10-10
dc.date.available2018-01-15T15:04:41Z-
dc.date.issued2017
dc.date.submitted2017-5-4
dc.identifier72174
dc.identifier.urihttp://hdl.handle.net/11025/27718
dc.description.abstractTato práce je zaměřena na sémantickou analýzu textů. Konkrétně na metody Explicitní sémantická analýza a Latentní sémantická analýza. Tyto metody jsou založené na trénování bez učitele a jako trénovací data využívají Wikipedii. Na výsledek metod je aplikován singulární rozklad matic, který redukuje paměťové nároky a zároveň vylepšuje výsledky metod. Testování výsledků je prováděno na standardních datasetech pro anglický a český jazyk. Tyto datasety obsahují páry slov a manuálně definovanou sémantickou podobnost. Kvalita sémantické reprezentace je měrena pomocí Pearsonovy a Spearmanovy korelace. Všechny testované metody dosahují na obou jazycích velmi dobrých výsledků.cs
dc.format36 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectzpracování přirozeného jazykacs
dc.subjectdistribuční sémantikacs
dc.subjectsémantická podobnostcs
dc.subjectvektorové sémantické prostorycs
dc.subjectexplicitní sémantická analýzacs
dc.subjectlatentní sémantická analýzacs
dc.subjectsingulární rozkladcs
dc.titleExplicitní sémantická analýzacs
dc.title.alternativeExplicit semantic analysisen
dc.typebakalářská prácecs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThis bachelor thesis investigates semantic analysis of texts in natural language. It focuses on Explicit Semantic Analysis and Latent Semantic Analysis methods. These methods are based on unsupervised machine learning and use Wikipedia as a training data. Singular Value Decomposition is used to reduce the memory requirements and also to improve the results. Standard English and Czech datasets are used for testing purposes. These datasets contain word pairs and manually annotated semantic similarity. The quality of semantic representation is evaluated by Pearson and Spearman correlation. All tested methods provide very promising results on both languages.en
dc.subject.translatednlpen
dc.subject.translateddistributional semanticsen
dc.subject.translatedsemantic similarityen
dc.subject.translatedvector space modelen
dc.subject.translatedexplicit semantic analysisen
dc.subject.translatedlatent semantic analysisen
dc.subject.translatedsingular value decompositionen
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_Tusl_A14B0453P.pdfPlný text práce516,22 kBAdobe PDFZobrazit/otevřít
A14B0453P-hodnoceni.pdfPosudek vedoucího práce235,16 kBAdobe PDFZobrazit/otevřít
A14B0453P-posudek.pdfPosudek oponenta práce412,13 kBAdobe PDFZobrazit/otevřít
A14B0453P-obhajoba.pdfPrůběh obhajoby práce185,69 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/27718

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.