Title: Segmentace stran rukopisných dokumentů
Other Titles: Page Segmentation of Handwritten Documents
Authors: Baloun, Josef
Advisor: Král Pavel, Doc. Ing. Ph.D.
Referee: Lenc Ladislav, Ing. Ph.D.
Issue Date: 2020
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/41748
Keywords: segmentace;analýza rozvržení;strana;dokument;ručně psané;kronika
Keywords in different language: segmentation;layout analysis;page;document;handwritten;chronicle
Abstract: Analýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada složená ze stran ručně psaných kronik. Dále je navržen prototyp systému pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno váhování chybové funkce a byla automaticky rozšířena trénovací množina.
Abstract in different language: Page layout analysis plays an important role in the process of document retrieval. It can still be a challenging task for historical handwritten documents due to their diverse structure and possible quality degradation. In this thesis, an overview of possible methods for solving this problem is presented and a dataset composed of the pages of handwritten chronicles is created. This thesis also presents a prototype of the system for page layout analysis. The segmentation and classification into text, image and background classes are solved as a pixel-labeling problem. The prototype is based on a fully convolutional neural network inspired by U-Net. The best results were achieved when the prototype was set to the processing of entire pages of documents, the loss function was weighted and the training set was automatically augmented.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
Baloun_Josef_2020_DP.pdfPlný text práce37,81 MBAdobe PDFView/Open
A18N0044Pposudek-op.PDFPosudek oponenta práce552,29 kBAdobe PDFView/Open
A18N0044Phodnoceni-ved.pdfPosudek vedoucího práce40,98 kBAdobe PDFView/Open
A18N0044Pobhajoba.PDFPrůběh obhajoby práce386,02 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/41748

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.