Title: Acoustic analysis of czech expressive recordings from a single speaker in terms of various communicative functions
Other Titles: Akustická analýza českých expresivních nahrávek jednoho řečníka z pohledu různých komunikačních funkcí
Authors: Grůber, Martin
Citation: GRŮBER, Martin. Acoustic analysis of czech expressive recordings from a single speaker in terms of various communicative functions. In: IEEE international symposium on signal processing and information technology. Vietnam: IEEE Press, 2011, p. 267-272. ISBN 978-1-4673-0753-6.
Issue Date: 2011
Publisher: IEEE Press
Document type: článek
article
URI: http://www.kky.zcu.cz/cs/publications/GruberM_2011_AcousticAnalysisof
http://hdl.handle.net/11025/17191
ISBN: 978-1-4673-0753-6
Keywords: akustická analýza;expresivní syntéza řeči;komunikační funkce
Keywords in different language: acoustic analysis;expressive speech synthesis;communication function
Abstract: Tato práce popisuje rozsáhlou akustickou analýzu řečových nahrávek, které byly namluveny jednou českou ženskou mluvčí s využitím různých expresivních řečnických stylů. Nahrávání expresivně zabarvených textů bylo provedeno formou dialogu mezi člověkem a počítačem na dané téma. Řeč člověka (mluvčího) byla nahrána a později pečlivě ručně přepsána. Řečové nahrávky také byly anotovány pomocí poslechového testu. Cílem těchto anotací bylo přiřadit každé promluvě odpovídající řečnický styl (tzv. komunikační funkci). Na základě takového označení byly expresivní nahrávky rozděleny do různých skupin a akusticky analyzovány. Zejména jsme kladli důraz na některé rysy, které mají vliv na vnímání řeči, jako F0, doba trvání fonémů, formantové frekvence a RMS energie. Snažili jsme se odhalit některé akustické rozdíly mezi jednotlivými řečnickými styly, které by nám mohly pomoci vylepšit expresivní syntézu řeči v dané omezené oblasti.
Abstract in different language: This paper presents an extensive acoustic analysis of utterances which were recorded by a single Czech female speaker using various expressive speaking styles. The recording of the expressive utterances was performed as a dialogue between a human and a computer on a given topic. Speech of the human speaker was captured and later carefully transcribed by human annotators. It was also annotated using a listening test. The aim of the annotations was to label each utterance with a corresponding speaking style (referred to as a communicative function). Based on such a labeling, the expressive recordings were classified into various groups and acoustically analyzed. In particular, we placed emphasis on some features which are supposed to influence the perception of speech, such as F0, phoneme duration, formant frequencies or energy. We made an effort to reveal some acoustic differences between the various speaking styles that could help us to improve expressive speech synthesis in a given limited domain.
Rights: © Martin Grůber
Appears in Collections:Články / Articles (NTIS)

Files in This Item:
File Description SizeFormat 
GruberM_2011_AcousticAnalysisof.pdfPlný text177,8 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/17191

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.