Title: Automatická fonetická segmentace TTS korpusů pomocí nástroje KALDI
Other Titles: Automatic phonetic segmentation of TTS corpora using the KALDI toolkit
Authors: Klíma, Michal
Advisor: Matoušek Jindřich, Doc. Ing. Ph.D.
Referee: Hanzlíček Zdeněk, Ing. Ph.D.
Issue Date: 2016
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/23646
Keywords: htk;kaldi;automatická fonetická segmentace;hmm;syntéza řeči
Keywords in different language: htk;kaldi;automatic phonetic segmentation;hmm;speech synthesis
Abstract: Tato práce je zaměřena na vytvoření automatické fonetické segmentace s využitím nástroje Kaldi. Algoritmus segmentace je vytvořen na základě postupů použitých pro automatickou fonetickou segmentaci s pomocí nástroje HTK. Rozdíl v přesnosti obou segmentací se pohybuje pouze okolo 1%. Dále jsou zkoumány možnosti vylepšení automatické segmentace (nové modely, různé parametrizace, atd.). Z vyhodnocení výsledků vyplývá, že především pro nový model je přesnost segmentace o několik procent zvýšena.
Abstract in different language: This work is focused on automatic phonetic segmentation using tool named Kaldi. Algorithm is developed based on the procedures used for automatic phonetic segmentation using tool named HTK. The difference in accuracy of both automatic segmentation is only around 1 %. There are also examined ways to improve automatic segmentation (new models, different parameterizations, etc.). The evaluation indicate that especially for the new model is a segmentation accuracy of a few percent increased.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KKY)

Files in This Item:
File Description SizeFormat 
DP.pdfPlný text práce1,83 MBAdobe PDFView/Open
klima-v.pdfPosudek vedoucího práce1,06 MBAdobe PDFView/Open
klima-o.pdfPosudek oponenta práce715,04 kBAdobe PDFView/Open
klima-p.pdfPrůběh obhajoby práce377,03 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/23646

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.