Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorMatoušek, Jindřich
dc.contributor.authorTihelka, Daniel
dc.date.accessioned2023-02-06T11:00:19Z-
dc.date.available2023-02-06T11:00:19Z-
dc.date.issued2022
dc.identifier.citationMATOUŠEK, J. TIHELKA, D. Sequence-to-Sequence CNN-BiLSTM Based Glottal Closure Instant Detection from Raw Speech. In Artificial Neural Networks in Pattern Recognition; 10th IAPR TC3 Workshop, ANNPR 2022; Dubai, United Arab Emirates, November 24-26, 2022; Proceedings. Cham: Springer Nature Switzerland AG, 2022. s. 107-120. ISBN: 978-3-031-20649-8 , ISSN: 0302-9743cs
dc.identifier.isbn978-3-031-20649-8
dc.identifier.issn0302-9743
dc.identifier.uri2-s2.0-85142752874
dc.identifier.urihttp://hdl.handle.net/11025/51298
dc.format14 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringer Nature Switzerland AGen
dc.relation.ispartofseriesArtificial Neural Networks in Pattern Recognition; 10th IAPR TC3 Workshop, ANNPR 2022; Dubai, United Arab Emirates, November 24-26, 2022; Proceedingsen
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelům.cs
dc.rights© The Author(s), under exclusive licence to Springer Nature B.V.en
dc.titleSequence-to-Sequence CNN-BiLSTM Based Glottal Closure Instant Detection from Raw Speechen
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.rights.accessrestrictedAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedIn this paper, we propose to frame glottal closure instant (GCI) de- tection from raw speech as a sequence-to-sequence prediction problem and to explore the potential of recurrent neural networks (RNNs) to handle this prob- lem. We compare the RNN architecture to widely used convolutional neural net- works (CNNs) and to some other machine learning-based and traditional non- learning algorithms on several publicly available databases. We show that the RNN architecture improves GCI detection. The best results were achieved for a joint CNN-BiLSTM model in which RNN is composed of bidirectional long short-term memory (BiLSTM) units and CNN layers are used to extract relevant features.en
dc.subject.translatedglottal closure instant detectionen
dc.subject.translateddeep learningen
dc.subject.translatedrecurrent neural networken
dc.subject.translatedconvolutional neural networken
dc.identifier.doi10.1007/978-3-031-20650-4_9
dc.type.statusPeer-revieweden
dc.identifier.obd43937100
dc.project.IDEF17_048/0007267/InteCom: VaV inteligentních komponent pokročilých technologií pro plzeňskou metropolitní oblastcs
dc.project.ID90140/Velká výzkumná infrastruktura_(J) - e-INFRA CZcs
dc.project.IDTL05000546/Využití multimediálního výkladového slovníku pro moderní výuku češtinycs
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Matousek_Tihelka_Sequence-to-Sequence_ANNPR_2022.pdf551,79 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/51298

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD