Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorKonopík Miloslav, Ing. Ph.D.
dc.contributor.authorKupilík, Filip
dc.contributor.refereeKrál Pavel, Doc. Ing. Ph.D.
dc.date.accepted2017-8-29
dc.date.accessioned2018-01-15T15:04:45Z-
dc.date.available2016-10-10
dc.date.available2018-01-15T15:04:45Z-
dc.date.issued2017
dc.date.submitted2017-6-29
dc.identifier71953
dc.identifier.urihttp://hdl.handle.net/11025/27699
dc.description.abstractCílem této práce je navrhnout, vytvořit a otestovat algoritmus pro identifi- kaci revizí v množině textových dokumentů. V první části práce jsou zmapo- vány současné přístupy ve vyhledávání dokumentů a popsány stávající algo- ritmy pro identifikaci podobných dokumentů. Druhá část se zabývá návrhem a implementací algoritmu zaměřeného na detekci revizí, jehož úspěšnost je ověřena na vytvořené kolekci testovacích dokumentů. Výsledky získané z provedených experimentů jsou porovnány s výsledky vybraných stávajících algoritmů.cs
dc.format49 s. (71189 znaků)cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectrevizecs
dc.subjectduplikátycs
dc.subjectapache lucenecs
dc.subjectvyhledávání informacícs
dc.subjectvektorový modelcs
dc.subjectkullback-leiblerova divergencecs
dc.subjectrozpoznávání pojmenovaných entitcs
dc.titleAutomatická identifikace revizí textových dokumentůcs
dc.title.alternativeAutomated Identification of Revisions of Text Documentsen
dc.typebakalářská prácecs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe goal of the thesis is to design, create and test an algorithm which iden- tifies the revisions of test documents. The first part of the thesis is focused on analysing current approaches to document searching and a identification of highly similar documents (near-duplicates). The second part deals with a design and an implementation of a new algorithm. The efficiency of the algorithm is verified on a set of test documents. The tests results are com- pared with the results of the experiments which were done with the selected existing algorithms.en
dc.subject.translatedrevisionen
dc.subject.translatedduplicatesen
dc.subject.translatedapache luceneen
dc.subject.translatedinformation retrievalen
dc.subject.translatedvector space modelen
dc.subject.translatedkullback-leibler divergenceen
dc.subject.translatednamed-entity recognitionen
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
bakalarka.pdfPlný text práce532,26 kBAdobe PDFZobrazit/otevřít
A14B0296P-hodnoceni.pdfPosudek vedoucího práce620,39 kBAdobe PDFZobrazit/otevřít
A14B0296P-posudek.pdfPosudek oponenta práce435,01 kBAdobe PDFZobrazit/otevřít
A14B0296P-obhajoba.pdfPrůběh obhajoby práce200,48 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/27699

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.