Full metadata record
DC FieldValueLanguage
dc.contributor.authorHlaváč, Miroslav
dc.date.accepted2019-12-19
dc.date.accessioned2020-08-24T11:43:15Z-
dc.date.available2018-11-19
dc.date.available2020-08-24T11:43:15Z-
dc.date.issued2019
dc.date.submitted2019-10-29
dc.identifier81346
dc.identifier.urihttp://hdl.handle.net/11025/39247
dc.description.abstractCílem této práce je vytvoření nových vizuálních příznaků pro systémy automatického odezírání ze rtů. Metody současného stavu poznání (především metody strojového učení) nevyužívají při svém trénování možnosti adaptace na konkrétního řečníka. Vyvstává tedy otázka, jak tuto metodu adaptace přizpůsobit pro oblast rozpoznávání vizuální řeči a jak ji implementovat do současných algoritmů pro strojové odezírání ze rtů. Pomocí analýzy současného stavu poznání v oblasti vizuálních příznaků pro rozpoznávání řeči navrhujeme novou parametrizaci LipsID a metodu pro její získání. Ukazujeme, že adaptací současných systému (založených na neuronových sítích) navrženou metodou LipsID se dá dosáhnout vyšší přesnosti rozpoznávání vizuální řeči. Význam této práce spočívá v prokázání významnosti příznaků založených na identitě řečníka pro automatické metody odezírání ze rtů.cs
dc.format105 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectodezírání ze rtůcs
dc.subjectstrojové učenícs
dc.subjectneuronové sítěcs
dc.subjectvizuální příznakycs
dc.subjectrozpoznávání řečics
dc.titleAutomatické odezírání ze rtů pomocí LipsIDcs
dc.title.alternativeAutomated lipreading using LipsIDen
dc.typedisertační prácecs
dc.thesis.degree-namePh.D.cs
dc.thesis.degree-levelDoktorskýcs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe aim of this is thesis is the creation of new visual features for the automatic lipreading systems. State-of-the-art methods (mainly machine learning methods) are not using any form of adaptation for a specific speaker during their training. We ask, how to adapt this method for the purpose of visual speech recognition and how to implement it into the current lipreading methods. Using the analysis of state-of-the-art methods for visual speech feature extraction we propose a new set of features LipsID and the method for extracting them. We show that by adapting the current system (based on neural networks) by the proposed LipsID features a higher recognition rate of the speech can be achieved. The significance of this work is in showing the importance of features based on the speaker identity for the task of lipreading.en
dc.title.otherAutomatické odezírání ze rtů pomocí příznaků LipsIDcs
dc.subject.translatedlipreadingen
dc.subject.translatedmachine learningen
dc.subject.translatedneural networksen
dc.subject.translatedvisual featuresen
dc.subject.translatedspeech recognitionen
Appears in Collections:Disertační práce / Dissertations (KKY)

Files in This Item:
File Description SizeFormat 
Hlavac_PhD_Thesis.pdfPlný text práce9,31 MBAdobe PDFView/Open
posudek-odp-hlavac.pdfPosudek oponenta práce300,45 kBAdobe PDFView/Open
protokol-odp-hlavac.pdfPrůběh obhajoby práce784,84 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/39247

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.