Full metadata record
DC FieldValueLanguage
dc.contributor.authorKanis, Jakub
dc.contributor.authorMüller, Luděk
dc.date.accessioned2016-01-06T13:09:00Z
dc.date.available2016-01-06T13:09:00Z
dc.date.issued2004
dc.identifier.citationKANIS, Jakub; MÜLLER, Luděk. Using the lemmatization technique for phonetic transcription in text-to-speech system. In: Text, speech and dialogue. Berlin: Springer, 2004, p. 355-361. (Lectures notes in computer science; 3206). ISBN 978-3-540-23049-6.en
dc.identifier.isbn978-3-540-23049-6
dc.identifier.urihttp://www.kky.zcu.cz/cs/publications/KanisJ_2004_Usingthe_1
dc.identifier.urihttp://hdl.handle.net/11025/17131
dc.description.abstractTento článek se zabývá technikou lemmatizace a jejím využitím pro fonetickou transkripci slov, jež jsou výjimkami z pravidelné fonetické transkripce. Lemmatizátor je založen na morfologii jazyka a používá slovník základních tvarů a množinu inverzních derivačních pravidel k nalezení lemmatizačních pravidel, která jsou nezbytná pro hledání základních tvarů slov. Dále je v článku popsán algoritmus lemmatizace a jeho nutné modifikace pro zajištění fonetické transkripce výjimek. Hlavním cílem navrženého systému je úspora paměti při uložení slovníku výjimek. Výsledky experimentů ukazují, že lze uspořit 18,3 % (Angličtina) až 98,4 % (Finština) velikosti plného slovníku výjimek. Navržená technika tedy může být s výhodou použita pro vysoce flexivní a aglutinační jazyky.cs
dc.format7 s.
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseriesLectures notes in computer science; 3206en
dc.rights© Jakub Kanis - Luděk Müllercs
dc.subjectlemmatizacecs
dc.subjectfonetická transkripcecs
dc.subjectvýjimky z fonetické transkripcecs
dc.titleUsing the lemmatization technique for phonetic transcription in text-to-speech systemen
dc.title.alternativeVyužití techniky lemmatizace pro fonetickou transkripci v text-to-speech systémucs
dc.typečlánekcs
dc.typearticleen
dc.rights.accessopenAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedThis paper deals with a lemmatization technique and its using for phonetic transcription of exceptional words. The lemmatizer is based on language morphology and uses a lexicon of basic word forms and a set of inversion derivation rules to acquire lemmatization rules, which are essential for finding word bases. The lemmatization algorithm and its necessary modifications for transcription of exceptional words are described. The main goal of the designed system is to save computer memory for exceptional lexicon storing. The experimental results showed that it is possible to save from 18.3 % (English) to 98.4 % (Finnish) of the full lexicon size. Hence, the described technique can be applied with advantage for high inflectional and agglutinative languages.en
dc.subject.translatedlemmatizationen
dc.subject.translatedphonetic transcriptionen
dc.subject.translatedexceptions from letter to sound conversionen
dc.type.statusPeer-revieweden
Appears in Collections:Články / Articles (NTIS)
Články / Articles (KKY)

Files in This Item:
File Description SizeFormat 
KanisJ_2004_Usingthe_1.pdfPlný text95,48 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/17131

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.