Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorGruber, Ivan
dc.contributor.authorHrúz, Marek
dc.contributor.authorIrcing, Pavel
dc.contributor.authorNeduchal, Petr
dc.contributor.authorZítka, Tomáš
dc.contributor.authorHlaváč, Miroslav
dc.contributor.authorZajíc, Zbyněk
dc.contributor.authorŠvec, Jan
dc.contributor.authorBulín, Martin
dc.date.accessioned2022-03-21T11:00:17Z-
dc.date.available2022-03-21T11:00:17Z-
dc.date.issued2021
dc.identifier.citationGRUBER, I. HRÚZ, M. IRCING, P. NEDUCHAL, P. ZÍTKA, T. HLAVÁČ, M. ZAJÍC, Z. ŠVEC, J. BULÍN, M. OCR Improvements for Images of Multi-page Historical Documents. In 23rd International Conference, SPECOM 2021, St. Petersburg, Russia, September 27–30, 2021, Proceedings. Cham: Springer, 2021. s. 226-237. ISBN: 978-3-030-87801-6 , ISSN: 0302-9743cs
dc.identifier.isbn978-3-030-87801-6
dc.identifier.issn0302-9743
dc.identifier.uri2-s2.0-85116373386
dc.identifier.urihttp://hdl.handle.net/11025/47184
dc.format12 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseries23rd International Conference, SPECOM 2021, St. Petersburg, Russia, September 27–30, 2021, Proceedingsen
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelům.cs
dc.rights© Springer Nature Switzerland AGen
dc.titleOCR Improvements for Images of Multi-page Historical Documentsen
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.rights.accessrestrictedAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedThis work presents a pipeline for processing digitally scanned documents, reading their textual content, and storing it in a dataset for the purpose of information retrieval. The pipeline is able to handle images of various quality, whether they were obtained by a digital scanner or camera. The image can contain multiple pages in any layout, but an approximate upright orientation is assumed. The pipeline uses Faster R-CNN to detect individual pages. These are then processed by a deskew algorithm to correct the orientation, and finally read by the Tesseract OCR system that has been retrained on a large set of synthetic images and a small set of annotated real-world documents. By applying the pipeline, we were able to increase the word recall to 60.56% which is an absolute gain of 19.19% from the baseline solution that uses only Tesseract OCR. A demo of the proposed pipeline can be found at https://archivkgb.zcu.cz/.en
dc.subject.translateddocument digitizationen
dc.subject.translateddocument layout analysisen
dc.subject.translatedoptical character recognitionen
dc.subject.translatedimage preprocessingen
dc.identifier.doi10.1007/978-3-030-87802-3_21
dc.type.statusPeer-revieweden
dc.identifier.obd43933456
dc.project.ID90042/Velká výzkumná infrastruktura povinnost (J) - CESNET IIcs
dc.project.IDDG20P02OVV018/Digitální archiv dokumentů NKVD/KGB vztahujících se k Československucs
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Gruber2021_Chapter_OCRImprovementsForImagesOfMult.pdf2,27 MBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/47184

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD