Title: Perspektivy řečové komunikace mezi člověkem a strojem
Other Titles: Perspectives of a speech communication between human and machine
Authors: Heiderová, Pavlína
Advisor: Romportl, Jan
Referee: Ircing, Pavel
Issue Date: 2013
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/9683
Keywords: rozpoznávání řeči;syntéza řeči;Uncanny valley;Wizard of OZ;projekt Senior Companions
Keywords in different language: speech recognition;speech synthesis;Uncanny valley;Wizard of OZ;project Senior Companions
Abstract: Cílem této práce je představit stav současných řečových technologií a upozornit na těžkosti, se kterými se vědci v tomto oboru potýkají. Za svatý grál ve vývoji řečových technologií je považováno vytvořit takový dialogový systém, který je schopen porozumět souvislé lidské řeči s nízkou chybovostí, s relativně neomezeným slovníkem a doménou, bez předchozí zkušenosti s mluvčím a zároveň schopným produkovat srozumitelnou a přirozenou řeč, tedy takový systém, který je nerozeznatelný od člověka. Tento cíl však v sobě může skrývat riziko zvané uncanny valley, reakci člověka na stroj, který vypadá a pohybuje se stejně jako člověk. Reakce člověka na takového robota může přejít od pozitivních pocitů k negativním, a interakce tak může být narušena, a to ve chvíli, kdy se robot svým vzhledem přiblíží člověku, ale jeho podoba je nedokonalá. Tato hypotéza je v této práci aplikována na použití řečových technologii v rámci projektu Senior Companions. Experimentální data pořízená v rámci tohoto projektu metodou Wizard of Oz prokázala, že synteticky znějící hlas může vyvolat podobné emoční reakce, které se odehrávají v mezilidské komunikaci. Pozorované subjekty cítily dostačující míru souznění s avatarem a zároveň strojově znějící hlas nenesl riziko, že se ocitne v uncanny valley. Bylo tak prokázáno, že syntetiticky znějící hlas může být nejen dostačující, ale i lepší, jelikož v sobě nenese riziko uncanny valley.
Abstract in different language: The aim of this paper is to present the state of speech technologies research and underscore the difficulties the scholars in this field of studies encounter. Creation of a dialogue systhem able to understand a coherent human speech with a low failure rate, relatively unlimited vocabulary and a domain without previous experience with speaker able at the same time to produce an understandable and natural speech, so a system indiscernible from human being, is being considered a holy greal in the development of speech technologies. However, this goal can bear a risk of the so called uncanny valley: a reaction of man to a machine that looks and moves similar to human. Man?s reaction to this kind of robot can range from positive throughout to negative feelings and the interaction can be thus disrupted at the time when the robot is although similar to man but, one the other hand, his appearance is still imperfect. This hypothesis is in this paper being applied to the use of speech technologies in the framework of Senior Companions project. Experimental data obtained in the frame of this project by using Wizard of Oz methods have shown that synthetically sounded voice can cause emotional reactions similar to those present in inter-human communication. Observed subjects felt a sufficient level of accord with avatar and, at the same time, machine sounded voice did not bring any risk of uncanny valley. It has also been proven that synthetically sounded voice can be not only sufficient but even better as there is no risk of uncanny valley.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KFI)

Files in This Item:
File Description SizeFormat 
DP_HEIDEROVA.pdfPlný text práce458,08 kBAdobe PDFView/Open
protokol_o_hodnoceni_prace_Heiderova_vedouci.pdfPosudek vedoucího práce141,56 kBAdobe PDFView/Open
protokol_o_hodnoceni_prace_Heiderova_oponent.rtfPosudek oponenta práce2,04 MBRTFView/Open
Heiderova_Pavlina.pdfPrůběh obhajoby práce453,27 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/9683

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.