Title: Segmentace historických obrazových dokumentů
Other Titles: Segmentation of historical document images
Authors: Liška, Miroslav
Advisor: Lenc Ladislav, Ing. Ph.D.
Referee: Král Pavel, Doc. Ing. Ph.D.
Issue Date: 2019
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/37423
Keywords: segmentace;historické dokumenty;konvoluční neuronové sítě
Keywords in different language: segmentation;historical documents;convolutional neural networks
Abstract: Správná segmentace obrazových dokumentů je jednou z nejdůležitějších součástí OCR systémů. Během ní jsou v obrázcích automaticky označovány oblasti zájmu, jako jsou například textové bloky, řádky textů, oddělovací čáry a jiné. Historické obrazové dokumenty jsou často různě deformované, obsahují šum a mají nepravidelnou strukturu a tak je úspěšná segmentace těchto dokumentů velkou výzvou. V rámci diplomové práce byly prozkoumány možné přístupy k segmentaci historických dokumentů a po následné analýze byly použity plně konvoluční neuronové sítě ARU-Net, U-Net a její úprava. Dále se práce věnuje tvorbě datové sady, zejména pak vytvoření očekávaných výsledků segmentace a nástrojům pro jejich vytvoření. Na základě dosažených výsledků modelů na této datové sadě je pro označování textu vybrána síť upravený U-Net, pro nalezení oddělovacích čar a pro označení řádků textu síť ARU-Net. Spojením výsledků jednotlivých sítí a jejich následným zpracováním byl vytvořen program, který ve vstupním obrázku detekuje a vyřezává řádky textu a to tak, aby bylo zachováno pořadí čtení. Takto získané řádky jsou vhodné pro další zpracování OCR.
Abstract in different language: Correct segmentation of image documents is one of the most important tasks in OCR. During segmentation, areas of interests such as text blocks, text lines and separators are automatically labeled. Historical image documents are often malformed, contain noise and have irregular structure. Because of these issues, successful segmentation of such documents presents a difficult challenge. This Master's thesis explores possible approaches to segmentation of historical documents, after subsequent analysis, fully convolutional neural networks ARU-Net and U-net and its variations were used for this task. This thesis also deals with manual creation of a data set, particularly with creation of expected results of segmentation and suitable tools for achieving this task. Based on results obtained from models trained on the created data set, variation of the U-net network was selected for text labeling and ARU-net for finding of separators and labeling of lines of text. The result of this thesis a program combining results of individual neural networks. This program is able to detect and cut lines of text from input images while retaining reading order. Text lines obtained from this program are suitable for further OCR processing.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Diplomové práce / Theses (KIV)

Files in This Item:
File Description SizeFormat 
Liska_Miroslav_2019.pdfPlný text práce56,47 MBAdobe PDFView/Open
A18N0094Phodnoceni-ved.PDFPosudek vedoucího práce373,24 kBAdobe PDFView/Open
A18N0094Pposudek-op.PDFPosudek oponenta práce414,16 kBAdobe PDFView/Open
A18N0094Pobhajoba.PDFPrůběh obhajoby práce192,36 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/37423

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.