Název: | Prohledávání dokumentů podle automaticky extrahovaných vzorů |
Další názvy: | Document retrieval using automaticaly extracted patterns |
Autoři: | Baloun, Josef |
Vedoucí práce/školitel: | Král Pavel, Doc. Ing. Ph.D. |
Oponent: | Lenc Ladislav, Ing. Ph.D. |
Datum vydání: | 2018 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/32259 |
Klíčová slova: | vyhledávání slov;ručně psané dokumenty;databáze parzival;neuronová síť;konvoluční neuronová síť;phoc vektor;spatial pyramid pooling;konvoluční lstm;experiment;mean average precision |
Klíčová slova v dalším jazyce: | word spotting;handwritten documents;parzival database;neural network;convolutional neural network;phoc vector;spatial pyramid pooling;convolutional lstm;experiment;mean average precision |
Abstrakt: | Tato bakalářská práce se zabývá návrhem a implementací metod, které umožní vyhledávání slov v ručně psaném textu. Předpokladem je již hotová segmentace dokumentu na obrázky slov. V první části práce jsou zmapovány dostupné datové kolekce pro vyhledávání v ručně psaných textech. Následuje seznámení s možnými řešeními, mezi kterými jsou zvoleny neuronové sítě. V druhé části jsou provedeny experimenty na datové kolekci Parzival. Účelem experimentů je ověření funkčnosti metod, hledání vhodné architektury sítě a zjištění vlivu jednotlivých částí metod na výsledek. Navrženy jsou tři metody založené na neuronových sítích, které se dokáží vypořádat s rozdílnou velikostí vstupních obrázků třemi způsoby. Tyto metody jsou otestovány a porovnány na databázi Parzival, kde dosáhli výborných výsledků. Nejlep- ších výsledků 92,62 % MAP QbS a 90,01 % MAP QbE bylo dosaženo s metodou, která je založena na konvoluční neuronové síti a PHOC reprezentaci výstupního vektoru. |
Abstrakt v dalším jazyce: | This bachelor thesis deals with the design and implementation of methods that allow the search of handwritten words. A prerequisite is the ready segmentation of the document to the word images. In the first part of the thesis, the available data collections are mapped for searching in handwritten texts, followed by a list of possible solutions among which neural networks are selected. In the second part, experiments are performed on the Parzival data collection. The purpose of the experiments is to verify the functionality of the methods, a search for an appropriate network architecture and to determine the effect of the individual parts of the methods on the result. Three methods based on neural networks are designed to deal with the different sizes of input images in three ways. These methods are tested and compared on the Parzival database where they have achieved excellent results. The best results of 92,62 % MAP QbS and 90,01 % MAP QbE were achieved with a method based on the convolutional neural network and the PHOC representation of the output vector. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
balounj_bakalarka.pdf | Plný text práce | 3 MB | Adobe PDF | Zobrazit/otevřít |
A15B0005P posudek.pdf | Posudek oponenta práce | 277,82 kB | Adobe PDF | Zobrazit/otevřít |
A15B0005P hodnoceni.pdf | Posudek vedoucího práce | 167,88 kB | Adobe PDF | Zobrazit/otevřít |
A15B0005P obhajoba.pdf | Průběh obhajoby práce | 84,08 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/32259
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.