Název: Dialogue Act-Based Expressive Speech Synthesis in Limited Domain for the Czech Language
Další názvy: Expresivní syntéza řeči pro český jazyk založená na dialogových aktech
Autoři: Grůber, Martin
Matoušek, Jindřich
Hanzlíček, Zdeněk
Tihelka, Daniel
Citace zdrojového dokumentu: GRŮBER, M., MATOUŠEK, J., HANZLÍČEK, Z., TIHELKA, D. Dialogue Act-Based Expressive Speech Synthesis in Limited Domain for the Czech Language. Informatica (Ljubljana), 2020, roč. 44, č. 2, s. 147-166. ISSN 0350-5596.
Datum vydání: 2020
Nakladatel: Slovene Society Informatika
Typ dokumentu: článek
article
URI: 2-s2.0-85090763750
http://hdl.handle.net/11025/42621
ISSN: 0350-5596
Klíčová slova: syntéza řeči;výběr jednotek;HMM;expresivita;dialogový akt;omezená doména
Klíčová slova v dalším jazyce: speech synthesis;unit selection;HMM;expressivity;dialogue act;limited domain
Abstrakt: Článek se zabývá syntézou expresivní řeči v dialogu. Pro popis expresivity jsou použity dialogové akty - diskrétní expresivní kategorie. Cílem této práce je popsat postup vývoje expresivní syntézy řeči pro dialogový systém v omezené oblasti. Zde je tato oblast omezena na rozhovory mezi člověkem a počítačem na témata týkající se osobních fotografií. Aby bylo možné začlenit do syntézy řeči expresivitu, je potřeba modifikovat stávající algoritmy používané pro syntézu neutrální řeči. Byl nahrán expresivní řečový korpus, data byla anotována předdefinovanou množinou dialogových aktů, a byla provedena akustická analýza tohoto korpusu. Pro syntézu expresivní řeči byly využity metody výběru jednotek a HMM. Jako výsledky jsou v článku uvedené výstupy z poslechových testů. Posluchači v nich hodnotili dva aspekty expresivní syntézy řeči pro izolované promluvy: kvalitu řeči a vnímání expresivity. Vyhodnocení je provedeno také pro promluvy v rámci dialogu pro ověření vhodnosti syntetické expresivní řeči. Závěrem je, že syntetická expresivní řeč je hodnocena pozitivně i když je o něco horší kvality než syntetická řeč neutrální. Syntetická expresivní řeč však skutečně umožňuje přenášet expresivitu na posluchače a tím zlepšuje přirozenost syntetické řeči.
Abstrakt v dalším jazyce: This paper deals with expressive speech synthesis in a dialogue. Dialogue acts - discrete expressive categories - are used for expressivity description. The aim of the work is to create a procedure for development of expressive speech synthesis for a dialogue system in a limited domain. The domain is here limited to dialogues between a human and a computer on a given topic of reminiscing about personal photographs. To incorporate expressivity into synthetic speech, modifications of current algorithms used for neutral speech synthesis are made. An expressive speech corpus is recorded, annotated using a predefined set of dialogue acts, and its acoustic analysis is performed. Unit selection and HMM-based methods are used to synthesize expressive speech, and an evaluation using listening tests is presented. The listeners asses two basic aspects of synthetic expressive speech for isolated utterances: speech quality and expressivity perception. The evaluation is also performed for utterances in a dialogue to asses appropriateness of synthetic expressive speech. It can be concluded that synthetic expressive speech is rated positively even though it is of worse quality when comparing with the neutral speech synthesis. However, synthetic expressive speech is able to transmit expressivity to listeners and to improve the naturalness of the synthetic speech.
Práva: Plný text není přístupný.
© Slovene Society Informatika
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Články / Articles (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
2020_Gruber_Dialogue_Act-Based_expressive_Speech_Synthesis.pdf805,97 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/42621

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD