Detail publikace
Spoof Diarization: "What Spoofed When" in Partially Spoofed Audio
WANG, X.
COOPER, E.
DIEZ SÁNCHEZ, M.
Landini Federico Nicolás, Ph.D. (VZ SPEECH)
EVANS, N.
YAMAGISHI, J.
částečná faleš, falešná diaizace, protiopatření, shlukování
Tento článek definuje Spoof Diarization jako nový úkol ve scénáři Partial Spoof
(PS). Jejím cílem je určit, co kdy bylo podvrženo, což zahrnuje nejen lokalizaci
oblastí podvržení, ale také jejich seskupení podle různých metod podvržení. Jako
průkopnická studie v oblasti spoof diarizace se zaměřujeme na definování úkolu,
stanovení hodnoticích metrik a návrh srovnávacího modelu, konkrétně modelu
Countermeasure-Condition Clustering (3C). S využitím tohoto modelu nejprve
prozkoumáme, jak efektivně trénovat protiopatření na podporu falešné diarizace
pomocí tří schémat označování. Potom použijeme předpovědi lokalizace spoof ke
zlepšení diarizačního výkonu. Tato první studie odhaluje vysokou složitost úkolu,
a to i v omezených scénářích, kde se uvažuje pouze s jedním mluvčím na zvukový
soubor a věšteckým množstvím spoofingových metod. Náš kód je k dispozici na
https://github.com/nii-yamagishilab/PartialSpoo
@inproceedings{BUT193676,
author="ZHANG, L. and WANG, X. and COOPER, E. and DIEZ SÁNCHEZ, M. and LANDINI, F. and EVANS, N. and YAMAGISHI, J.",
title="Spoof Diarization: {"}What Spoofed When{"} in Partially Spoofed Audio",
booktitle="Proceedings of Interspeech 2024",
year="2024",
journal="Proceedings of Interspeech",
volume="2024",
number="9",
pages="502--506",
publisher="International Speech Communication Association",
address="Kos",
doi="10.21437/Interspeech.2024-1365",
issn="1990-9772",
url="https://www.isca-archive.org/interspeech_2024/zhang24j_interspeech.pdf"
}