Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorŘezáčková, Markéta
dc.contributor.authorŠvec, Jan
dc.contributor.authorTihelka, Daniel
dc.date.accessioned2022-03-28T10:00:27Z-
dc.date.available2022-03-28T10:00:27Z-
dc.date.issued2021
dc.identifier.citationŘEZÁČKOVÁ, M. ŠVEC, J. TIHELKA, D. T5G2P: Using Text-to-Text Transfer Transformer for Grapheme-to-Phoneme Conversion. In Proceedings of the Annual Conference of the International Speech Communication Association, Interspeech. Red Hook, NY: International Speech Communication Association, 2021. s. 3291-3295. ISBN: 978-1-71383-690-2 , ISSN: 2308-457Xcs
dc.identifier.isbn978-1-71383-690-2
dc.identifier.issn2308-457X
dc.identifier.uri2-s2.0-85115262876
dc.identifier.urihttp://hdl.handle.net/11025/47249
dc.format5 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherInternational Speech Communication Associationen
dc.relation.ispartofseriesProceedings of the Annual Conference of the International Speech Communication Association, Interspeechen
dc.rightsPlný text není přístupný.cs
dc.rights© ISCAen
dc.titleT5G2P: Using Text-to-Text Transfer Transformer for Grapheme-to-Phoneme Conversionen
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.rights.accessclosedAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedDespite the increasing popularity of end-to-end text-to-speech (TTS) systems, the correct grapheme-to-phoneme (G2P) module is still a crucial part of those relying on a phonetic input. In this paper, we, therefore, introduce a T5G2P model, a Text-to-Text Transfer Transformer (T5) neural network model which is able to convert an input text sentence into a phoneme sequence with a high accuracy. The evaluation of our trained T5 model is carried out on English and Czech, since there are different specific properties of G2P, including homograph disambiguation, cross-word assimilation and irregular pronunciation of loanwords. The paper also contains an analysis of a homographs issue in English and offers another approach to Czech phonetic transcription using the detection of pronunciation exceptions.en
dc.subject.translatedgrapheme-to-phonemeen
dc.subject.translatedphonetic transcriptionen
dc.subject.translatedT5en
dc.subject.translatedtransformersen
dc.subject.translatedTTS systemen
dc.identifier.doi10.21437/Interspeech.2021-546
dc.type.statusPeer-revieweden
dc.identifier.obd43933414
dc.project.IDGA19-19324S/Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítícs
dc.project.IDSGS-2019-027/Inteligentní metody strojového vnímání a porozumění 4cs
dc.project.ID90140/Velká výzkumná infrastruktura_(J) - e-INFRA CZcs
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
rezackova21_interspeech.pdf167,67 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/47249

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD