Detail publikace
DPCCN: Densely-Connected Pyramid Complex Convolutional Network for Robust Speech Separation and Extraction
Long Yanhua
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
DPCCN, Mixture-Remix, cross-domain, speech separation, unsupervised target speech extraction
V posledních letech byla navržena řada metod separace řeči v time-domain. Většina z nich je však velmi citlivána prostředí a na úlohy k pokrytí široké domény. V tomhle článku, z hlediska časově-frekvenční domény navrhujeme hustě propojený pyramidový komplex konvoluční sítě, tzvDPCCN, za účelem zlepšení robustnosti separace řeči za komplikovanýchpodmínek. Dále zobecňujeme DPCCN na cílenouextrakci řeči (TSE) integrací nového speciálně navrženéhokodér mluvčího. Kromě toho také zkoumáme robustnostDPCCN na úkoly TSE mezi doménami bez dohledu. Přístup za pomoci Mix-Remixuje navržen k přizpůsobení akustických charakteristik cílové doménypro jemné doladění modelu zdroje. Hodnotíme navrženémetody nejen za hlučných a dozvukových podmínek v doméně,ale také v čistých, ale mezidoménových podmínkách. Výsledky ukazují, že proseparace a extrakce řeči, systémy založené na DPCCNdosáhují výrazně lepšího výkonu a robustnosti než v současnostidominující metody v časové oblasti, zejména pro crossdoménovéúlohy. Zejména jsme zjistili, že jemné ladění Mixture-Remixs DPCCN výrazně překonává TD-SpeakerBeampro TSE mezi doménami bez dohledu, se zlepšením SISNR přibližně o 3,5 dBna testovací sadě cílové domény, bez jakéhokoli výkonu zdrojové doménydegradace.
@inproceedings{BUT178382,
author="Jiangyu {Han} and Yanhua {Long} and Lukáš {Burget} and Jan {Černocký}",
title="DPCCN: Densely-Connected Pyramid Complex Convolutional Network for Robust Speech Separation and Extraction",
booktitle="ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings",
year="2022",
pages="7292--7296",
publisher="IEEE Signal Processing Society",
address="Singapore",
doi="10.1109/ICASSP43922.2022.9747340",
isbn="978-1-6654-0540-9",
url="https://ieeexplore.ieee.org/document/9747340"
}