Title: Modelově-orientované přístupy pro automatickou hudební transkripci
Other Titles: Model-based Approaches for Automatic Transcription of Music
Authors: Albrecht, Štěpán
Advisor: Matoušek, Václav
Issue Date: 2014
Publisher: Západočeská univerzita v Plzni
Document type: disertační práce
URI: http://hdl.handle.net/11025/12980
Keywords: metoda variační bayes;variační bayesovská technika;variační bayes;bayesovské modelování;bayesovský model;pravděpodobnostní model;automatický přepis hudby;automatická hudební transkripce;úplná automatická hudební transkripce;model hudeního signálu;audio na midi
Keywords in different language: variational bayes;variational bayes method;bayesian model;probabilistic model;music signal model;automatic music transcription;memory-based automatic music transription;complete automatic music transription;entire automatic music transription;audio to midi
Abstract: Disertační práce se zabývá problémem úplné automatické hudební transkripce. Úplná automatická hudební transkripce, tj. detekce (i) všech zvuků v čase, (ii) nástrojů jejich reprodukce a (iii) jejich hlasitostí, je složitý a v některých případech dokonce teoreticky neřešitelný problém. I když zmíněné tři charakteristiky hudebního obsahu nesou úplnou informaci k reprodukování skladby, někdy tvoří jen data pro další zpracování, např. pro získání tempa skladby jako další charakteristiky hudebního obsahu. Proto se úplná hudební transkripce omezuje na scénář -- záměr -- v rámci kterého usiluje o zachycení všech charakteristik. V této práci definujeme inverzní hudební sekvencer jako tento scénář. Mono-audio hudební signál a knihovna (banka zvuků) tvoří vstupní data inverzního hudebního sekvenceru. V knihovně mohou být nahrávky harmonických zvuků (piano, flétna, ...), zvuky bicích nástrojů, případně celé nahrávky jimi tvořené. Navrhujeme pravděpodobnostní model, jehož odhadované proměnné nesou informaci o parametrech zkrácení knihovních zvuků hledaných ve vstupním hudebním signálu, jejich rozmístění v čase a jejich amplitudách. Detekce podčástí knihovních zvuků je vlastnost, kterou detekujeme jen ve scénáři našeho inverzního hudebního sekvenceru, jiné postupy pracují se zvukem jako s celkem. Pro výpočet neznámých proměnných je aplikována variační Bayesovská technika. Zavádíme metody vyhodnocování pro scénář inverzního hudebního sekvenceru. V části ''Experimenty'' provádíme citlivostní analýzu v závislosti na vstupním hudebním signálu, knihovně zvuků, volných parametrech modelu a různých modifikacích transkripčního algoritmu. Jedna knihovna zvuků v našich experimentech obsahuje pouze zvuky -- tóny jednoho harmonického hudebního nástroje, a tak rozpoznávání hudebních nástrojů není součástí testů, i když navržené transkripční algoritmy jsou vhodné i pro něj.
Abstract in different language: The problem of memory based complete automatic music transcription is considered. The complete automatic music transcription, i.e., estimation of (i) all sounds in time, (ii) their instrumentation and (iii) their loudnesses, is a di cult and in some cases even not solvable problem. Even though the three named music content features carry the entire information for the original music signal composition, they can represent observed data for further processing, e.g., of the music piece tempo as another music content feature. Therefore the practical complete automatic music transcription follows a scenario an intention and tries to capture all the features within the scenario. In this work, the inverse music sequencer as a speci c scenario for the complete automatic music transcription is de ned. A monoaural music signal and the library of sounds as an input of the inverse music sequencer is considered. The sounds in the library are to be composed of harmonic sounds (a piano, a flute, ...) and drum sounds. A probabilistic model containing unobserved variables which re ect information of truncation parameters of library sounds sought in the observed signal their displacements in time and their amplitudes is designed. The detection of subparts of the library sounds is a distinct feature of our approach in comparison to other approaches that consider only full sequences of frames. Variational Bayes method to calculate equations of estimates of the unobserved variables is applied. Evaluation methods for the speci c intention of the inverse music sequencer are introduced. In the experimental part, the sensitivity analysis respecting an observed music signal, library of sounds, nuisance parameters and various modi cations of the transcription algorithm is carried out. In experiments, one sound library contains harmonic sounds of one music instrument, thus music instrument recognition is not a part of our experiments although the proposed transcription algorithms are developed for this too.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Disertační práce / Dissertations (KIV)

Files in This Item:
File Description SizeFormat 
d05_06_final.pdfPlný text práce2,31 MBAdobe PDFView/Open
posudky-odp-albrecht.pdfPosudek oponenta práce5,48 MBAdobe PDFView/Open
protokol-odp-albrecht.pdfPrůběh obhajoby práce897,13 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/12980

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.