Title: Parameterization of the input in training the HVS semantic parser
Other Titles: Parametrizace vstupu při trénování HVS sémantického parseru
Authors: Švec, Jan
Jurčíček, Filip
Müller, Luděk
Citation: ŠVEC, Jan; JURČÍČEK, Filip; MÜLLER, Luděk. Parameterization of the input in training the HVS semantic parser. In: Text, speech nad dialoque. Berlin: Springer, 2007, p. 415-422. (Lecture notes in computer science; 4629). ISBN 978-3-540-74627-0.
Issue Date: 2007
Publisher: Springer
Document type: článek
article
URI: http://www.kky.zcu.cz/cs/publications/SvecJ_2007_Parameterizationof
http://hdl.handle.net/11025/16971
ISBN: 978-3-540-74627-0
Keywords: sémantické parsování;model se skrytým stavovým vektorem;porozumění řeči
Keywords in different language: semantic parsing;hidden vector state model;language understanding
Abstract: Cílem tohoto článku je popis rozšíření původního sémantického parseru se skrytým stavovým vektorem. Nejprve je popsáno statistické sémantické parsování a jeho dekompozice na sémantický a lexikální model. Následně popisujeme původní parser se skrytým stavovým vektorem. Poté popisujeme modifikaci jeho lexikálního modelu tak, že je možné na vstupu parseru použít posloupnost příznakových vektorů namísto posloupnosti slov. Příznakové vektory vytváříme na základě automaticky generovaných lingvistických příznaků (lemma a morfologická značka původního slova). Rovněž popisujeme vliv zahrnutí původního slova do příznakového vektoru. Na závěr práce vyhodnocujeme modifikovaný sémantický parser na českém korpusu obsahujícím dialogy týkající se příjezdů a odjezdů vlaků. Přesnost sémantického parseru vzrostla statisticky významným způsobem v porovnání s výchozím systémem – původním parserem se skrytým stavovým vektorem.
Abstract in different language: The aim of this paper is to present an extension of the hidden vector state semantic parser. First, we describe the statistical semantic parsing and its decomposition into the semantic and the lexical model. Subsequently, we present the original hidden vector state parser. Then, we modify its lexical model so that it supports the use of the input sequence of feature vectors instead of the sequence of words. We compose the feature vector from the automatically generated linguistic features (lemma form and morphological tag of the original word). We also examine the effect of including the original word into the feature vector. Finally, we evaluate the modified semantic parser on the Czech Human-Human train timetable corpus. We found that the performance of the semantic parser improved significantly compared with the baseline hidden vector state parser.
Rights: © Jan Švec - Filip Jurčíček - Luděk Müller
Appears in Collections:Články / Articles (KKY)

Files in This Item:
File Description SizeFormat 
SvecJ_2007_Parameterizationof.pdfPlný text161,79 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/16971

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.