Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorBrychcín, Tomáš
dc.date.accessioned2020-06-01T10:00:10Z-
dc.date.available2020-06-01T10:00:10Z-
dc.date.issued2020
dc.identifier.citationBRYCHCÍN, T. . Linear transformations for cross-lingual semantic textual similarity. Knowledge-Based Systems, 2020, roč. 187, č. 1, s. 1-9. ISSN 0950-7051.en
dc.identifier.issn0950-7051
dc.identifier.uri2-s2.0-85068031029
dc.identifier.urihttp://hdl.handle.net/11025/36955
dc.description.abstractCross-lingual semantic textual similarity systems estimate the degree of the meaning similarity between two sentences, each in a different language. State-of-the-art algorithms usually employ machine translation and combine vast amount of features, making the approach strongly supervised, resource rich, and difficult to use for poorly-resourced languages. In this paper, we study linear transformations, which project monolingual semantic spaces into a shared space using bilingual dictionaries. We propose a novel transformation, which builds on the best ideas from prior works. We experiment with unsupervised techniques for sentence similarity based only on semantic spaces and we show they can be significantly improved by the word weighting. Our transformation outperforms other methods and together with word weighting leads to very promising results on several datasets in different languages.en
dc.description.abstractSystémy pro kroslinguální sémantickou podobnost textů odhadují stupeň podobnosti významů mezi dvěma větami v různých jazycích. Nejnovější algoritmy obvykle používají strojový překlad a kombinují obrovské množství nejrůznějších nástrojů. To způsobuje, že tento přístup je silně supervizovaný, náročný na zdroje, a obtížný pro použití na okrajových jazycích. V tomto článku studujeme lineární transformace, které převádí monolinguální sémantické prostory do sdíleného prostoru pomocí bilinguálních slovníků. Představujeme novou transformaci, která je založena na nejlepších publikovaných přístupech. Experimentujeme s nesupervizovanými technikami pro podobnost vět založených výhradně na sémantických prostorech a ukazujeme, že tento přístup může být dále vylepšen pomocí vážení slov. Naše transformace překonává ostatní metody a společně s vážením slov vede k velmi slibným výsledkům na několika datasetech v různých jazycích.cs
dc.format9 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherElsevieren
dc.relation.ispartofseriesKnowledge-Based Systemsen
dc.rightsPlný text není přístupný.cs
dc.rights© Elsevieren
dc.subjectSémantická podobnost textůcs
dc.subjectSémantické prostorycs
dc.subjectLineární transformacecs
dc.subjectSlovní reprezentacecs
dc.subjectKroslinguální sémantické prostorycs
dc.titleLinear transformations for cross-lingual semantic textual similarityen
dc.title.alternativeLineární transformace pro kroslinguální sémantickou podobnost textůcs
dc.typečlánekcs
dc.typearticleen
dc.rights.accessclosedAccessen
dc.type.versionpublishedVersionen
dc.subject.translatedSemantic spacesen
dc.subject.translatedLinear transformationsen
dc.subject.translatedWord embeddingsen
dc.subject.translatedCross-lingual semantic spaces Semantic textual similarityen
dc.identifier.doi10.1016/j.knosys.2019.06.027
dc.type.statusPeer-revieweden
dc.identifier.document-number501653900008
dc.identifier.obd43927549
dc.project.IDEF17_048/0007267/InteCom: VaV inteligentních komponent pokročilých technologií pro plzeňskou metropolitní oblastcs
Vyskytuje se v kolekcích:Články / Articles (KIV)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Brychcín KBS.pdf480,98 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36955

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD