Title: | Automatické odezírání ze rtů pomocí LipsID |
Other Titles: | Automated lipreading using LipsID |
Authors: | Hlaváč, Miroslav |
Issue Date: | 2019 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | disertační práce |
URI: | http://hdl.handle.net/11025/39247 |
Keywords: | odezírání ze rtů;strojové učení;neuronové sítě;vizuální příznaky;rozpoznávání řeči |
Keywords in different language: | lipreading;machine learning;neural networks;visual features;speech recognition |
Abstract: | Cílem této práce je vytvoření nových vizuálních příznaků pro systémy automatického odezírání ze rtů. Metody současného stavu poznání (především metody strojového učení) nevyužívají při svém trénování možnosti adaptace na konkrétního řečníka. Vyvstává tedy otázka, jak tuto metodu adaptace přizpůsobit pro oblast rozpoznávání vizuální řeči a jak ji implementovat do současných algoritmů pro strojové odezírání ze rtů. Pomocí analýzy současného stavu poznání v oblasti vizuálních příznaků pro rozpoznávání řeči navrhujeme novou parametrizaci LipsID a metodu pro její získání. Ukazujeme, že adaptací současných systému (založených na neuronových sítích) navrženou metodou LipsID se dá dosáhnout vyšší přesnosti rozpoznávání vizuální řeči. Význam této práce spočívá v prokázání významnosti příznaků založených na identitě řečníka pro automatické metody odezírání ze rtů. |
Abstract in different language: | The aim of this is thesis is the creation of new visual features for the automatic lipreading systems. State-of-the-art methods (mainly machine learning methods) are not using any form of adaptation for a specific speaker during their training. We ask, how to adapt this method for the purpose of visual speech recognition and how to implement it into the current lipreading methods. Using the analysis of state-of-the-art methods for visual speech feature extraction we propose a new set of features LipsID and the method for extracting them. We show that by adapting the current system (based on neural networks) by the proposed LipsID features a higher recognition rate of the speech can be achieved. The significance of this work is in showing the importance of features based on the speaker identity for the task of lipreading. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Disertační práce / Dissertations (KKY) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Hlavac_PhD_Thesis.pdf | Plný text práce | 9,31 MB | Adobe PDF | View/Open |
posudek-odp-hlavac.pdf | Posudek oponenta práce | 300,45 kB | Adobe PDF | View/Open |
protokol-odp-hlavac.pdf | Průběh obhajoby práce | 784,84 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/39247
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.