Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorKanis, Jakub
dc.contributor.authorMüller, Luděk
dc.date.accessioned2016-01-06T12:43:03Z
dc.date.available2016-01-06T12:43:03Z
dc.date.issued2005
dc.identifier.citationKANIS, Jakub; MÜLLER, Luděk. Using lemmatization technique for automatic diacritics restoration. In: SPECOM 2005 Proceedings. St. Petersburg: Institute for Informatics and Automation of RAS (SPIIRAS), 2005, p. 255-258. ISBN 5-7452-0110-X.en
dc.identifier.isbn5-7452-0110-X
dc.identifier.urihttp://www.kky.zcu.cz/cs/publications/KanisJ_2005_Usinglemmatization
dc.identifier.urihttp://hdl.handle.net/11025/17128
dc.description.abstractTento článek se zabývá automatickou konstrukcí lematizátoru z Plný tvar - Lema trénovacího slovníku a lematizací nových, v trénovacím slovníku neviděných, tj. OOV slov. Jsou představeny tři metody pro lematizaci tří různých typů OOV slov (chybějící plné tvary, složená a neznámá slova). Nakonec je posána aplikace metody pro automatickou konstrukci lematizátoru na problém obnovení diakritiky.cs
dc.format4 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherMoscow state linguistic universityen
dc.rights© Jakub Kanis - Luděk Müllercs
dc.subjectlemmatizacecs
dc.subjectOOV slovacs
dc.subjectobnovení diakritikycs
dc.titleUsing lemmatization technique for automatic diacritics restorationen
dc.title.alternativeVyužítí techniky lematizace pro obnovení diakritikycs
dc.typečlánekcs
dc.typearticleen
dc.rights.accessopenAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedThis paper is devoted to automatic construction of a lemmatizer from a Full Form - Lemma (FFL) training dictionary, and to lemmatization of new, in the FFL dictionary unseen - i.e. out-of-vocabulary (OOV), words. Three methods of lemmatization of three kinds of OOV words (missing full forms, unknown words, and compound words) are introduced. In addition, the application of lemmatizer automatic construction to the problem of automatic diacritics restoration is described.en
dc.subject.translatedlemmatizationen
dc.subject.translatedOOV wordsen
dc.subject.translateddiacritics restorationen
dc.type.statusPeer-revieweden
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Články / Articles (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
KanisJ_2005_Usinglemmatization.pdfPlný text69,15 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17128

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.