Detail publikace
Source Separation for Sound Event Detection in domestic environments using jointly trained models
Žmolíková Kateřina, Ing., Ph.D. (UPGM FIT VUT)
Torre Toledano Doroteo (UAM)
Detekce zvukové události, oddělení zdroje, DCASE, DESED
Detekce zvukových událostí a separace zdrojů jsou úzce související úkoly: zatímco první si klade za cíl najít časové hranice akustických událostí uvnitř nahrávky, cílem druhého je izolovat každý z akustických zdrojů na různé signály. Tento článek představuje systém detekce zvukových událostí tvořený dvěma nezávisle předem připravenými bloky pro separaci zdrojů a detekci zvukových událostí. Navrhujeme schéma společného tréninku, kde se trénují oba bloky současně, a dvoustupňový trénink, kdy každý blok trénuje, zatímco druhý je zmrazený. Kromě toho porovnáváme použití předtréninku pod dohledem a bez dozoru pro blok Separation a dvě strategie výběru modelu pro detekci zvukových událostí. Naše experimenty ukazují, že navrhované metody jsou schopny překonat základní systémy výzvy DCASE 2021 Challenge Task 4.
@INPROCEEDINGS{FITPUB12857, author = "Diego Gorron Benito de and Kate\v{r}ina \v{Z}mol\'{i}kov\'{a} and Doroteo Toledano Torre", title = "Source Separation for Sound Event Detection in domestic environments using jointly trained models", pages = "1--5", booktitle = "Proceedings of The 17th International Workshop on Acoustic Signal Enhancement (IWAENC 2022)", year = 2022, location = "Bamberg, DE", publisher = "IEEE Signal Processing Society", ISBN = "978-1-6654-6867-1", doi = "10.1109/IWAENC53105.2022.9914755", language = "english", url = "https://www.fit.vut.cz/research/publication/12857" }