Title: Prohledávání dokumentů podle automaticky extrahovaných vzorů
Authors: Baloun, Josef
Citation: RENDL, Jan ed. Studentská vědecká konference: bakalářské studijní programy, sborník rozšířených abstraktů, květen 2019, Plzeň. Plzeň: Západočeská univerzita v Plzni, 2018, s. 27-28. ISBN 978-80-261-0789-7.
Issue Date: 2018
Publisher: Západočeská univerzita v Plzni
Document type: konferenční příspěvek
conferenceObject
URI: http://hdl.handle.net/11025/29856
svk.fav.zcu.cz/download/sbornik_svkb_2018.pdf
ISBN: 978-80-261-0789-7
Keywords: vyhledávání informací;optické rozpoznávání znaků;neuronové sítě;historické dokumenty
Keywords in different language: information retrieval;optical character recognition;neural networks;historical documents
Abstract: Prohledávání dokumentů podle automaticky extrahovaných vzorů je problém z oblasti information retrieval. Lze ho také nalézt pod pojmy jako rozpoznávání nebo vyhledávání slov v ručně psyných dokumentech. V anglické literatuře je nejčastěji použit termín word spotting. Toto prohledávání je děleno podle vstupního kritéria, kterým může být obrazový vzor (dále jako QbE) nebo textový řetězec (dále jako QbS). Při prohledávání se snažíme na základě vstupního kritéria nalézt obrázky s odpovídajícím slovem. Úspěšné vyřešení by usnadnilo práci např. v situaci, kdy má historik najít v kronice, která obsahuje 1 000 stran textu, všechny zmínky o klášteře v Teplé. Cílem této práce je návrh a implementace metod, které umožní vyhledávání těchto slov. Předpokladem je předem provedená segmentace dokumentu na obrázky slov. K dosažení tohoto cíle jsou použity neuronové sítě.
Rights: © Západočeská univerzita v Plzni
Appears in Collections:Studentská vědecká konference 2018-bakalářské studijní programy
Studentská vědecká konference 2018-bakalářské studijní programy
Studentská vědecká konference 2018-bakalářské studijní programy

Files in This Item:
File Description SizeFormat 
Baloun1.pdfPlný text202,13 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/29856

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.