Title: Vysokodimenzionální prostory a modelování v úloze rozpoznávání řečníka
Other Titles: High dimensional spaces and modelling in the task of speaker recognition
Authors: Machlica, Lukáš
Advisor: Radová, Vlasta
Issue Date: 2013
Publisher: Západočeská univerzita v Plzni
Document type: disertační práce
URI: http://hdl.handle.net/11025/10777
Keywords: model Gaussovských směsí;support vector machine;supervektor;faktorová analýza;redukce dimenze;rozpoznávání řečníka
Keywords in different language: Gaussian mixture models;support vector machine;supervector;factor analysis;dimensionality reduction;speaker recognition
Abstract: Během posledních dvou desetiletí bylo v úloze automatického rozpoznávání řečníka dosaženo výrazných pokroků. Byly nahrány obrovské řečové databáze obsahující tisíce řečníků mluvících na různých akustických kanálech. Zároveň byly vyvinuty metody, které se snaží z těchto dat extrahovat co nejvíce informací. Nejmodernější metody jsou založeny na modelech Gaussovských směsí. S jejich pomocí jsou z příznakových vektorů, extrahovaných z řečových dat řečníků, počítány statistiky. Tyto statistiky jsou následně zřetězeny/pospojovány do vysokorozměrných vektorů - supervektorů. Práce se zabývá podrobným popisem metod extrakce vysokodimenzionálních supervektorů společně s technikami jejich modelování. Hlavní důraz je kladen na analýzu těchto metod, jejich propojení, a protože je při trénování systému rozpoznávání řečníka potřeba zpracovat veliké množství vstupních dat, i na jejich efektivní implementaci. Je také experimentálně vyšetřen vliv dat pro trénování na kvalitu rozpoznávání.
Abstract in different language: The automatic speaker recognition made a significant progress in the last two decades. Huge speech corpora containing thousands of speakers recorded on several channels are at hand, and methods utilizing as much information as possible were developed. Nowadays state-of-the-art methods are based on Gaussian mixture models used to estimate relevant statistics from feature vectors extracted from the speech of a speaker, which are further concatenated into a high dimensional vector - supervector. Methods concerning the extraction of high dimensional supervectors along with techniques capable to build a speaker model in such a high dimensional space are described in depth and links between these methods are found. The main emphasize is laid on the analysis of these methods and an efficient implementation in order to process huge amounts of development data to train the speaker recognition system. Also the influence of development corpora on the recognition performance is experimentally tested.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Disertační práce / Dissertations (KKY)

Files in This Item:
File Description SizeFormat 
dizertace_machlica.pdfPlný text práce3,38 MBAdobe PDFView/Open
hodnoceni-skolitel-machlica.pdfPosudek vedoucího práce370,99 kBAdobe PDFView/Open
posudek-ODP-machlica.pdfPosudek oponenta práce2,35 MBAdobe PDFView/Open
protokol-ODP-machlica.pdfPrůběh obhajoby práce721,53 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/10777

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.