Název: Rozpoznávání řeči pacientů po totální laryngektomii komunikujících pomocí elektrolarynxu
Další názvy: Speech recognition of patients after total laryngectomy communicating by electrolarynx
Autoři: Stanislav, Petr
Datum vydání: 2020
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: disertační práce
URI: http://hdl.handle.net/11025/41889
Klíčová slova: rozpoznávání řeči;totální laryngektomie;elektrolarynx;duration model;tdnn;dnn
Klíčová slova v dalším jazyce: automatic speech recognition;total laryngectomy;electrolarynx;duration model;tdnn;dnn
Abstrakt: Předkládaná disertační práce se zabývá problematikou rozpoznávání řeči pacientů, kteří podstoupili totální laryngektomii, a k produkci hlasu využívají elektrolarynx. V první části práce jsou přiblíženy důvody ztráty hlasu a metody, které jsou v současnosti využívány pro jeho rehabilitaci spolu s~jejich principy. Významnou pomoc s rehabilitací hlasu mohou poskytnout řečové technologie zpracovávající přirozenou řeč. Z tohoto důvodu jsou v práci popsány metody, které jsou využívány pro konstrukci automatických systémů rozpoznávání řeči (ASR). S ohledem na specifika řeči generované za pomoci elektrolarynxu je v práci prezentován postup pro sestavení speciálního řečového korpusu složeného z nahrávek hlasu pacienta po totální laryngektomii. Specifická řečová data slouží následně pro otestování robustnosti obecného systému rozpoznávání řeči. Získané výsledky však indikují potřebu navrhnout speciální ASR systém s individuálními požadavky vzhledem ke specifikům rozpoznávané řeči. Následně je navrženo několik postupů úpravy akustických dat za účelem zvýšení přesnosti rozpoznávání. Jako nejúčinnější se ukázalo protažení neznělých fonémů, proto byl vyvíjený ASR systém rozšířen o modul zohledňující právě toto protažení. V práci je popsáno nemalé množství experimetů, které byly provedeny za účelem ověření dílčích hypotéz.
Abstrakt v dalším jazyce: This dissertation thesis deals with speech recognition of patients who have undergone total laryngectomy and who use electrolarynx for voice production. In the first part of the thesis, the reasons of voice loss and methods that are currently used for its rehabilitation together with their principles are described. Significant help with voice rehabilitation can be provided by speech technologies processing natural speech. For this reason, the methods that are used for the construction of automatic speech recognition systems (ASR) are described. Regarding the specifics of speech generated with the help of electrolarynx, the paper presents a procedure for assembling a special speech corpus consisting of recordings of the patient's voice after total laryngectomy. The specific speech data is then used to test the robustness of the general speech recognition system. However, the obtained results indicate the need to design a special ASR system with individual requirements due to the specifics of the speech. Subsequently, several methods for adjusting acoustic data are proposed to increase recognition accuracy. The elongation of voiceless phonemes proved to be the most effective, so the developed ASR system was extended by a module taking into account this elongation. The work describes a considerable number of experiments, which were conducted to verify partial hypotheses.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Disertační práce / Dissertations (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
stanislav-thesis_online.pdfPlný text práce6,97 MBAdobe PDFZobrazit/otevřít
posudky-odp-stanislav.pdfPosudek oponenta práce532,38 kBAdobe PDFZobrazit/otevřít
protokol-odp-stanislav.pdfPrůběh obhajoby práce609,59 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/41889

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.