Název: Recent improvements on ARTIC: czech text-to-speech system
Další názvy: Nejnovější vylepšení českého TTS systému ARTIC
Autoři: Matoušek, Jindřich
Romportl, Jan
Tihelka, Daniel
Tychtl, Zbyněk
Citace zdrojového dokumentu: MATOUŠEK, Jindřich; ROMPORTL, Jan; TIHELKA, Daniel; TYCHTL, Zbyněk. Recent improvements on ARTIC: czech text-to-speech system. In: Proceedings of ICSPL 2004: 8th Annual Conference of the International Speech Communication Association 2004, Jeju Island, Korea, 4-8 October 2004. [Baixas]: ISCA, 2004, p. 1933-1936.
Datum vydání: 2004
Nakladatel: ISCA
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/MatousekJ_2004_RecentImprovements_1
http://hdl.handle.net/11025/17027
Klíčová slova: syntéza řeči;automatická vytváření inventáře akustických jednotek;modelování rázu;shlukování řečových jednotek;automatická segmentace řeči;datově řízené generování prozodie
Klíčová slova v dalším jazyce: speech synthesis;automatic acoustic unit inventory creation;glottal stop modelling;speech unit clustering;automatic speech segmentation;data-driven prosody generation
Abstrakt: Článek prezentuje nejnovější vylepšení systému ARTIC, moderního českého korpusově orientovaného TTS systému. Protože jsme použili statistický přístup (skryté Markovovy modely) k vytvoření inventáře akustických jednotek, vylepšení se týkala všech jeho komponent. Vylepšeným modelováním, shlukováním, a segmentací akustických jednotek jsme dosáhli zvýšené srozumitelnosti výsledné řeči. Navrhli jsme rovněž 2 přístupy ke generování prozodických charakteristik a získali tak vyšší přirozenost syntetické řeči. Abychom zvýšili i plynulost vytvářené řeči, navrhli jsme rovněž schéma využívající více realizací každé řečové jednotky s výběrem nejvhodnějšího kandidáta on-line. Zmíníme také alternativní metodu vytváření řeči využívající harmonický model a model šumu. Implementací německého a slovenského jazykového modulu (vedle 2 českých hlasů) jsme navíc vytvořili důležitý krok směrem k vícejazyčnosti našeho TTS systému ARTIC.
Abstrakt v dalším jazyce: This paper presents recent improvements on ARTIC - the modern Czech corpus-based text-to-speech system. As a statistical approach (using hidden Markov models) was applied to create an acoustic unit inventory, several improvements concerning acoustic unit modelling, clustering and segmentation have been accomplished to increase the intelligibility of the resulting speech. Two approaches to the generation of prosodic features were also proposed and implemented to increase the naturalness of synthetic speech. To produce as smooth synthetic speech as possible, a multiple unit instance scheme with on-line unit candidate selection was proposed as well. Our work on an alternative harmonic/noise-based speech production method is also mentioned. In addition, an important step towards multilinguality was achieved as German and Slovak language modules were implemented besides two Czech voices within the framework of ARTIC TTS system.
Práva: © Jindřich Matoušek - Jan Romportl - Daniel Tihelka - Zbyněk Tychtl
Vyskytuje se v kolekcích:Články / Articles (MMI)
Články / Articles (KKY)
Články / Articles (NTIS)
Články / Articles (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
MatousekJ_2004_RecentImprovements_1.pdfPlný text553,47 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17027

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.