Automatic Grammar Correction of Commas in Czech Written Texts: Comparative Study

Machura, Jakub; Frémund, Adam; Švec, Jan

Název:	Automatic Grammar Correction of Commas in Czech Written Texts: Comparative Study
Další názvy:	Automatická gramatická oprava čárek v česky psaných textech: Srovnávací studie
Autoři:	Machura, Jakub Frémund, Adam Švec, Jan
Citace zdrojového dokumentu:	MACHURA, J. FRÉMUND, A. ŠVEC, J. Automatic Grammar Correction of Commas in Czech Written Texts: Comparative Study. In Text, Speech, and Dialogue 25th International Conference, TSD 2022, Brno, Czech Republic, September 6–9, 2022, Proceedings. Cham: Springer International Publishing, 2022. s. 113-124. ISBN: 978-3-031-16269-5 , ISSN: 0302-9743
Datum vydání:	2022
Nakladatel:	Springer International Publishing
Typ dokumentu:	konferenční příspěvek ConferenceObject
URI:	2-s2.0-85139022640 http://hdl.handle.net/11025/50923
ISBN:	978-3-031-16269-5
ISSN:	0302-9743
Klíčová slova:	Oprava gramatických chyb;Jazyková pravidla;Transfer učení
Klíčová slova v dalším jazyce:	Grammatical erroe correction;Linguistic rules;Transfer learning
Abstrakt:	Úkol opravy gramatických chyb je široce studovanou oblastí zpracování přirozeného jazyka, kde tradiční přístupy založené na pravidlech soutěží s metodami strojového učení. Přístup založený na pravidlech těží především z široké znalostní báze dostupné pro daný jazyk. Naopak metody transferového učení a zejména použití předem natrénovaných Transformerů mají schopnost natrénovat se z obrovského množství textů v daném jazyce. V tomto příspěvku se zaměřujeme na úlohu automatické opravy chybějících čárek v česky psaných textech a porovnáváme přístup založený na pravidlech s modelem založeným na transformátoru trénovaným pro tuto úlohu.
Abstrakt v dalším jazyce:	The task of grammatical error correction is a widely studied field of natural language processing where the traditional rule-based approaches compete with the machine learning methods. The rule-based approach benefits mainly from a wide knowledge base available for a given language. On the contrary, the transfer learning methods and especially the use of pre-trained Transformers have the ability to be trained from a huge number of texts in a given language. In this paper, we focus on the task of automatic correction of missing commas in Czech written texts and we compare the rule-based approach with the Transformer-based model trained for this task.
Práva:	Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © Springer Nature Switzerland AG
Vyskytuje se v kolekcích:	Konferenční příspěvky / Conference papers (NTIS) Konferenční příspěvky / Conference Papers (KKY) OBD

Soubory připojené k záznamu:

Soubor	Velikost	Formát
Machura_Fremund_Svec-Automatic_Grammar_Correction_TSD_2022.pdf	605,6 kB	Adobe PDF	Zobrazit/otevřít Vyžádat kopii

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/50923

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace