Title: Collection and preprocessing of czech sign language corpus for sign language recognition
Other Titles: Tvorba a předzpracování korpusu českého znakového jazyka pro automatické rozpoznávání znakového jazyka
Authors: Campr, Pavel
Hrúz, Marek
Trojanová, Jana
Citation: Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08): 28-29-30 May 2008. Marrakech: ELRA, 2008, p. [1-4]. ISBN 2-9517408-4-0.
Issue Date: 2008
Publisher: ELRA
Document type: článek
article
URI: http://www.kky.zcu.cz/cs/publications/CamprP_2008_Collectionand
http://hdl.handle.net/11025/17204
ISBN: 2-9517408-4-0
Keywords: automatické rozpoznávání znakové řeči;česká znaková řeč;zpracování obrazu
Keywords in different language: sign language recognition;czech sign language;image processing
Abstract: Tento článek popisuje tvorbu, nahrávání a předzpracování korpusu českého znakového jazyka. Korpus slouží pro trénování a testování automatických systémů pro rozpoznávání znakového jazyka. Tento korpus UWB-07-SLP-P obsahuje videonahrávky 4 znakujících osob, které jsou nasnímány za 3 pohledů. Dva z nich zachytávají celou osobu, třetí je zaměřena na obličej. Každý znakující provedl 378 znaků, každý pětkrát opakován. Korpus obsahuje celkem 21853 videosouborů v délce 11,1 hodin. Každý znak je předzpracován a jsou dostupné základní příznaky, jako např. trajektorie rukou v 3D prostoru.
Abstract in different language: This paper discusses the design, recording and preprocessing of a Czech sign language corpus. The corpus is intended for training and testing of sign language recognition (SLR) systems. The UWB-07-SLR-P corpus contains video data of 4 signers recorded from 3 different perspectives. Two of the perspectives contain whole body and provide 3D motion data, the third one is focused on signer’s face and provide data for face expression and lip feature extraction. Each signer performed 378 signs with 5 repetitions. The corpus consists of several types of signs: numbers (35 signs), one and two-handed finger alphabet (64), town names (35) and other signs (244). Each sign is stored in a separate AVI file. In total the corpus consists of 21853 video files in total length of 11.1 hours. Additionally each sign is preprocessed and basic features such as 3D hand and head trajectories are available. The corpus is mainly focused on feature extraction and isolated SLR rather than continuous SLR experiments.
Rights: © Pavel Campr - Marek Hrúz - Jana Trojanová
Appears in Collections:Články / Articles (KIV)

Files in This Item:
File Description SizeFormat 
CamprP_2008_Collectionand.pdfPlný text979,77 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/17204

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.