Vysokodimenzionální prostory a modelování v úloze rozpoznávání řečníka

Machlica, Lukáš

Title:	Vysokodimenzionální prostory a modelování v úloze rozpoznávání řečníka
Other Titles:	High dimensional spaces and modelling in the task of speaker recognition
Authors:	Machlica, Lukáš
Advisor:	Radová, Vlasta
Issue Date:	2013
Publisher:	Západočeská univerzita v Plzni
Document type:	disertační práce
URI:	http://hdl.handle.net/11025/10777
Keywords:	model Gaussovských směsí;support vector machine;supervektor;faktorová analýza;redukce dimenze;rozpoznávání řečníka
Keywords in different language:	Gaussian mixture models;support vector machine;supervector;factor analysis;dimensionality reduction;speaker recognition
Abstract:	Během posledních dvou desetiletí bylo v úloze automatického rozpoznávání řečníka dosaženo výrazných pokroků. Byly nahrány obrovské řečové databáze obsahující tisíce řečníků mluvících na různých akustických kanálech. Zároveň byly vyvinuty metody, které se snaží z těchto dat extrahovat co nejvíce informací. Nejmodernější metody jsou založeny na modelech Gaussovských směsí. S jejich pomocí jsou z příznakových vektorů, extrahovaných z řečových dat řečníků, počítány statistiky. Tyto statistiky jsou následně zřetězeny/pospojovány do vysokorozměrných vektorů - supervektorů. Práce se zabývá podrobným popisem metod extrakce vysokodimenzionálních supervektorů společně s technikami jejich modelování. Hlavní důraz je kladen na analýzu těchto metod, jejich propojení, a protože je při trénování systému rozpoznávání řečníka potřeba zpracovat veliké množství vstupních dat, i na jejich efektivní implementaci. Je také experimentálně vyšetřen vliv dat pro trénování na kvalitu rozpoznávání.
Abstract in different language:	The automatic speaker recognition made a significant progress in the last two decades. Huge speech corpora containing thousands of speakers recorded on several channels are at hand, and methods utilizing as much information as possible were developed. Nowadays state-of-the-art methods are based on Gaussian mixture models used to estimate relevant statistics from feature vectors extracted from the speech of a speaker, which are further concatenated into a high dimensional vector - supervector. Methods concerning the extraction of high dimensional supervectors along with techniques capable to build a speaker model in such a high dimensional space are described in depth and links between these methods are found. The main emphasize is laid on the analysis of these methods and an efficient implementation in order to process huge amounts of development data to train the speaker recognition system. Also the influence of development corpora on the recognition performance is experimentally tested.
Rights:	Plný text práce je přístupný bez omezení.
Appears in Collections:	Disertační práce / Dissertations (KKY)

Files in This Item:

File	Description	Size	Format
dizertace_machlica.pdf	Plný text práce	3,38 MB	Adobe PDF	View/Open
hodnoceni-skolitel-machlica.pdf	Posudek vedoucího práce	370,99 kB	Adobe PDF	View/Open
posudek-ODP-machlica.pdf	Posudek oponenta práce	2,35 MB	Adobe PDF	View/Open
protokol-ODP-machlica.pdf	Průběh obhajoby práce	721,53 kB	Adobe PDF	View/Open

Show full item record

Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/10777

search

navigation