Název: Investigation of segmentation in i-vector based speaker diarization of telephone speech
Další názvy: Segmentace v systému pro diarizaci řečníka založeném na i-vektorech pro telefonní řeč
Autoři: Zajíc, Zbyněk
Kunešová, Marie
Radová, Vlasta
Citace zdrojového dokumentu: ZAJÍC, Zbyněk; KUNEŠOVÁ, Marie; RADOVÁ, Vlasta. Investigation of segmentation in i-vector based speaker diarization of telephone speech. In: SPECOM 2016 Proceedings: 18th International Conference on Speech and Computer, 23-27 August 2016, Budapest. Budapest: Moskow state linguistic university, 2016, p. 411-418. ISBN 978-3-319-43957-0 (Print); 978-3-319-43958-7 (Online).
Datum vydání: 2016
Nakladatel: Springer
Typ dokumentu: konferenční příspěvek
conferenceObject
URI: http://www.kky.zcu.cz/cs/publications/ZbynekZajic_2016_Investigationof
http://hdl.handle.net/11025/25663
ISBN: 978-3-319-43957-0 (Print)
978-3-319-43958-7 (Online)
Klíčová slova: diarizace řečníka;detekce změny řečníka;segmentace;i-vektor
Klíčová slova v dalším jazyce: speaker diarization;speaker change detection;segmentation;i-vector
Abstrakt: Článek se zabývá přínosem detekce změny řečníka (SCD) v úloze diarizace pro telefonní konverzace. Porovnali jsme úspěšnost diarizačního systému založeného na i-vektorech používající naivní segmentaci (konstantní délka okna) a SCD. Experimenty na CallHome korpusu dokázali lepší úspěšnost diarizace s pomocí SCD, ale rozdíly mezi testovanými přístupy byly nakonec smazány použítím resegmentace.
Abstrakt v dalším jazyce: The goal of this paper is to evaluate the contribution of speaker change detection (SCD) to the performance of a speaker diarization system in the telephone domain. We compare the overall performance of an i-vector based system using both SCD-based segmentation and a naive constant length segmentation with overlapping segments. The diarization system performs K-means clustering of i-vectors which represent the individual segments, followed by a resegmentation step. Experiments were done on the English part of the CallHome corpus. The final results indicate that the use of speaker change detection is beneficial, but the differences between the two segmentation approaches are diminished by the use of resegmentation.
Práva: © Springer International Publishing Switzerland
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference Papers (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Zajic.pdfPlný text404,58 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/25663

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.