Název: Segmentace stran rukopisných dokumentů
Další názvy: Page Segmentation of Handwritten Documents
Autoři: Baloun, Josef
Vedoucí práce/školitel: Král Pavel, Doc. Ing. Ph.D.
Oponent: Lenc Ladislav, Ing. Ph.D.
Datum vydání: 2020
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/41748
Klíčová slova: segmentace;analýza rozvržení;strana;dokument;ručně psané;kronika
Klíčová slova v dalším jazyce: segmentation;layout analysis;page;document;handwritten;chronicle
Abstrakt: Analýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada složená ze stran ručně psaných kronik. Dále je navržen prototyp systému pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno váhování chybové funkce a byla automaticky rozšířena trénovací množina.
Abstrakt v dalším jazyce: Page layout analysis plays an important role in the process of document retrieval. It can still be a challenging task for historical handwritten documents due to their diverse structure and possible quality degradation. In this thesis, an overview of possible methods for solving this problem is presented and a dataset composed of the pages of handwritten chronicles is created. This thesis also presents a prototype of the system for page layout analysis. The segmentation and classification into text, image and background classes are solved as a pixel-labeling problem. The prototype is based on a fully convolutional neural network inspired by U-Net. The best results were achieved when the prototype was set to the processing of entire pages of documents, the loss function was weighted and the training set was automatically augmented.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Baloun_Josef_2020_DP.pdfPlný text práce37,81 MBAdobe PDFZobrazit/otevřít
A18N0044Pposudek-op.PDFPosudek oponenta práce552,29 kBAdobe PDFZobrazit/otevřít
A18N0044Phodnoceni-ved.pdfPosudek vedoucího práce40,98 kBAdobe PDFZobrazit/otevřít
A18N0044Pobhajoba.PDFPrůběh obhajoby práce386,02 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/41748

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.