Title: Klasifikace skenovaných dokumentů
Other Titles: Classification of scanned documents
Authors: Fafek, Jakub
Advisor: Martínek Jiří, Ing. Ph.D.
Referee: Pártl František, Ing.
Issue Date: 2024
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/57111
Keywords: klasifikace dokumentu;skenovaný dokument;neuronová síť;klasifikace textu;klasifikace obrázku;ocr
Keywords in different language: document classification;scanned document;neural network;text classification;image classification;ocr
Abstract: Tato bakalářská práce se zabývá tématem klasifikace skenovaných dokumentů. Cílem této práce je vyvinout klasifikátor, který bude schopen rozlišit naskenované dokumenty do celkem deseti tříd. Jako příznak se použije text, který je rozpoznán pomocí metod optického rozpoznávání znaků (OCR). Dále bude využita hluboká konvoluční neuronová síť, která zohlední vizuální příznaky. Nakonec bude vytvořen klasifikátor, který zohledňuje oba typy příznaků. Klasifikátor bude vyhodnocen na datové sadě dokumentů Tobacco-3482.
Abstract in different language: This bachelor thesis deals with the topic of classification of scanned documents. The aim of this thesis is to develop a~classifier that will be able to distinguish scanned documents into a~total of ten classes. Text will be used as a~feature which is recognized using optical character recognition (OCR) methods. Furthermore, a~deep convolutional neural network will be used to take visual features into account. Finally, a~classifier will be created that accounts for both types of features. The classifier will be evaluated on the Tobacco-3482 document dataset.
Rights: Plný text práce je přístupný bez omezení
Appears in Collections:Bakalářské práce / Bachelor´s works (KIV)

Files in This Item:
File Description SizeFormat 
A19B0034P_text_prace.pdfPlný text práce1,36 MBAdobe PDFView/Open
A19B0034P_Posudek.pdfPosudek oponenta práce215,39 kBAdobe PDFView/Open
A19B0034P_Hodnoceni.pdfPosudek vedoucího práce233,25 kBAdobe PDFView/Open
A19B0034P_Obhajoba.pdfPrůběh obhajoby práce124,5 kBAdobe PDFView/Open

Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/57111

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.