Title: Automatické odezírání ze rtů pomocí LipsID
Other Titles: Automated lipreading using LipsID
Authors: Hlaváč, Miroslav
Issue Date: 2019
Publisher: Západočeská univerzita v Plzni
Document type: disertační práce
URI: http://hdl.handle.net/11025/39247
Keywords: odezírání ze rtů;strojové učení;neuronové sítě;vizuální příznaky;rozpoznávání řeči
Keywords in different language: lipreading;machine learning;neural networks;visual features;speech recognition
Abstract: Cílem této práce je vytvoření nových vizuálních příznaků pro systémy automatického odezírání ze rtů. Metody současného stavu poznání (především metody strojového učení) nevyužívají při svém trénování možnosti adaptace na konkrétního řečníka. Vyvstává tedy otázka, jak tuto metodu adaptace přizpůsobit pro oblast rozpoznávání vizuální řeči a jak ji implementovat do současných algoritmů pro strojové odezírání ze rtů. Pomocí analýzy současného stavu poznání v oblasti vizuálních příznaků pro rozpoznávání řeči navrhujeme novou parametrizaci LipsID a metodu pro její získání. Ukazujeme, že adaptací současných systému (založených na neuronových sítích) navrženou metodou LipsID se dá dosáhnout vyšší přesnosti rozpoznávání vizuální řeči. Význam této práce spočívá v prokázání významnosti příznaků založených na identitě řečníka pro automatické metody odezírání ze rtů.
Abstract in different language: The aim of this is thesis is the creation of new visual features for the automatic lipreading systems. State-of-the-art methods (mainly machine learning methods) are not using any form of adaptation for a specific speaker during their training. We ask, how to adapt this method for the purpose of visual speech recognition and how to implement it into the current lipreading methods. Using the analysis of state-of-the-art methods for visual speech feature extraction we propose a new set of features LipsID and the method for extracting them. We show that by adapting the current system (based on neural networks) by the proposed LipsID features a higher recognition rate of the speech can be achieved. The significance of this work is in showing the importance of features based on the speaker identity for the task of lipreading.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Disertační práce / Dissertations (KKY)

Files in This Item:
File Description SizeFormat 
Hlavac_PhD_Thesis.pdfPlný text práce9,31 MBAdobe PDFView/Open
posudek-odp-hlavac.pdfPosudek oponenta práce300,45 kBAdobe PDFView/Open
protokol-odp-hlavac.pdfPrůběh obhajoby práce784,84 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/39247

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.