Čtení textů pomocí metod hlubokého učení

Andrlík, Pavel

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.advisor	Hrúz Marek, Ing. Ph.D.
dc.contributor.author	Andrlík, Pavel
dc.contributor.referee	Soukup Lukáš, Ing.
dc.date.accepted	2022-6-22
dc.date.accessioned	2022-06-27T22:23:57Z	-
dc.date.available	2021-10-1
dc.date.available	2022-06-27T22:23:57Z	-
dc.date.issued	2022
dc.date.submitted	2022-5-30
dc.identifier	89614
dc.identifier.uri	http://hdl.handle.net/11025/48953	-
dc.description.abstract	Tato diplomová práce pojednává o problému optického rozpoznávání znaků při použití neuronových sítí. Zaměřuji se na zlepšení detekce a rozpoznávání textu pomocí dotrénování E2E-MLT scénového detektoru textu tak, že ho trénuji na umělých datech, která napodobují reálná data. Model byl dotrénováván na několika datasetech obsahujících uměle generovaná a reálná data, poté byly vybrány nejlepší modely a otestovány na jednom umělém a dvou reálných datasetech, jeden s převahou divokého textu, druhý s většinou textu vtištěného televizním zpravodajstvím. Na datasetu s většinout digitálně vložených textů bylo dosaženo zlepšení snížením chybovosti znaků z 52\% na 31.6\% a chybovosti slov z 56.5\% na 22\%. Během experimentů bylo také zjištěno, že trénování modelů na umělých datech simulující skutečné obrázky ze zpravodajství zhoršuje schopnost sítě detekovat a číst reálné divoké texty.	cs
dc.format	51
dc.language.iso	en
dc.publisher	Západočeská univerzita v Plzni
dc.relation.isreferencedby	https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89614	-
dc.rights	Plný text práce je přístupný bez omezení
dc.subject	neuronová síť	cs
dc.subject	optické rozpoznávání znaků	cs
dc.subject	detektor textu ve scéně	cs
dc.subject	hluboké učení	cs
dc.subject	generování dat	cs
dc.title	Čtení textů pomocí metod hlubokého učení	cs
dc.title.alternative	Optical character recognition using deep learning	en
dc.type	diplomová práce
dc.thesis.degree-name	Ing.
dc.thesis.degree-level	Navazující
dc.thesis.degree-grantor	Západočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-program	Aplikované vědy a informatika
dc.description.result	Obhájeno
dc.description.abstract-translated	This diploma thesis deals with the problem of optical character recognition (OCR) using neural networks. I am focusing on improving text detection and OCR by fine-tuning an E2E-MLT scene text detector by training it on synthetic data which emulates real data. The model was fine-tuned on several datasets with synthetically generated data and real data, then the models were tested on one synthetic and two real datasets, one with the majority of the wild text, the second with the majority of TV news imprinted text. On the dataset with majority of TV news imprinted texts the fine-tuned models achieved improvement by decreasing character error rate from 52\% to 31.6\% word error rate and from 56.5\% to 22\%. It was also experimentally discovered that training models on synthetic data simulating real TV news images deteriorate detection and reading model capability on wild text data.	en
dc.title.other	Čtení textů pomocí metod hlubokého učení
dc.subject.translated	neural network	en
dc.subject.translated	optical character recognition	en
dc.subject.translated	scene text detector	en
dc.subject.translated	deep learning	en
dc.subject.translated	data generating	en
Vyskytuje se v kolekcích:	Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
Thesis___Pavel_Andrlik.pdf	Plný text práce	8,17 MB	Adobe PDF	Zobrazit/otevřít
Andrlik_V.pdf	Posudek vedoucího práce	492,11 kB	Adobe PDF	Zobrazit/otevřít
Andrlik_O.pdf	Posudek oponenta práce	472,13 kB	Adobe PDF	Zobrazit/otevřít
Andrlik_P.pdf	Průběh obhajoby práce	237,5 kB	Adobe PDF	Zobrazit/otevřít
Zadani_DP_Pavel_Andrlik.pdf	VŠKP - příloha	43,96 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/48953

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace