Název: Prohledávání dokumentů podle automaticky extrahovaných vzorů
Další názvy: Document retrieval using automaticaly extracted patterns
Autoři: Baloun, Josef
Vedoucí práce/školitel: Král Pavel, Doc. Ing. Ph.D.
Oponent: Lenc Ladislav, Ing. Ph.D.
Datum vydání: 2018
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/32259
Klíčová slova: vyhledávání slov;ručně psané dokumenty;databáze parzival;neuronová síť;konvoluční neuronová síť;phoc vektor;spatial pyramid pooling;konvoluční lstm;experiment;mean average precision
Klíčová slova v dalším jazyce: word spotting;handwritten documents;parzival database;neural network;convolutional neural network;phoc vector;spatial pyramid pooling;convolutional lstm;experiment;mean average precision
Abstrakt: Tato bakalářská práce se zabývá návrhem a implementací metod, které umožní vyhledávání slov v ručně psaném textu. Předpokladem je již hotová segmentace dokumentu na obrázky slov. V první části práce jsou zmapovány dostupné datové kolekce pro vyhledávání v ručně psaných textech. Následuje seznámení s možnými řešeními, mezi kterými jsou zvoleny neuronové sítě. V druhé části jsou provedeny experimenty na datové kolekci Parzival. Účelem experimentů je ověření funkčnosti metod, hledání vhodné architektury sítě a zjištění vlivu jednotlivých částí metod na výsledek. Navrženy jsou tři metody založené na neuronových sítích, které se dokáží vypořádat s rozdílnou velikostí vstupních obrázků třemi způsoby. Tyto metody jsou otestovány a porovnány na databázi Parzival, kde dosáhli výborných výsledků. Nejlep- ších výsledků 92,62 % MAP QbS a 90,01 % MAP QbE bylo dosaženo s metodou, která je založena na konvoluční neuronové síti a PHOC reprezentaci výstupního vektoru.
Abstrakt v dalším jazyce: This bachelor thesis deals with the design and implementation of methods that allow the search of handwritten words. A prerequisite is the ready segmentation of the document to the word images. In the first part of the thesis, the available data collections are mapped for searching in handwritten texts, followed by a list of possible solutions among which neural networks are selected. In the second part, experiments are performed on the Parzival data collection. The purpose of the experiments is to verify the functionality of the methods, a search for an appropriate network architecture and to determine the effect of the individual parts of the methods on the result. Three methods based on neural networks are designed to deal with the different sizes of input images in three ways. These methods are tested and compared on the Parzival database where they have achieved excellent results. The best results of 92,62 % MAP QbS and 90,01 % MAP QbE were achieved with a method based on the convolutional neural network and the PHOC representation of the output vector.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
balounj_bakalarka.pdfPlný text práce3 MBAdobe PDFZobrazit/otevřít
A15B0005P posudek.pdfPosudek oponenta práce277,82 kBAdobe PDFZobrazit/otevřít
A15B0005P hodnoceni.pdfPosudek vedoucího práce167,88 kBAdobe PDFZobrazit/otevřít
A15B0005P obhajoba.pdfPrůběh obhajoby práce84,08 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/32259

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.