Detail publikace

Spoof Diarization: "What Spoofed When" in Partially Spoofed Audio

ZHANG Lin, WANG Xin, COOPER Erica, DIEZ Sánchez Mireia, LANDINI Federico Nicolás, EVANS Nicholas a YAMAGISHI Junichi. Spoof Diarization: "What Spoofed When" in Partially Spoofed Audio. In: Proceedings of Interspeech 2024. Kos: International Speech Communication Association, 2024, s. 502-506. ISSN 1990-9772. Dostupné z: https://www.isca-archive.org/interspeech_2024/zhang24j_interspeech.pdf
Název česky
Diarizace hlasových podvrhů: určení "Co kdy bylo podvrženo" v částečně podvrženém audiu
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Zhang Lin (SOKENDAI)
Wang Xin (NII)
Cooper Erica (NII)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM FIT VUT)
Landini Federico Nicolás (UPGM FIT VUT)
Evans Nicholas (EURECOM)
Yamagishi Junichi (SOKENDAI)
URL
Klíčová slova

částečná faleš, falešná diaizace, protiopatření, shlukování

Abstrakt

Tento článek definuje Spoof Diarization jako nový úkol ve scénáři Partial Spoof (PS). Jejím cílem je určit, co kdy bylo podvrženo, což zahrnuje nejen lokalizaci oblastí podvržení, ale také jejich seskupení podle různých metod podvržení. Jako průkopnická studie v oblasti spoof diarizace se zaměřujeme na definování úkolu, stanovení hodnoticích metrik a návrh srovnávacího modelu, konkrétně modelu Countermeasure-Condition Clustering (3C). S využitím tohoto modelu nejprve prozkoumáme, jak efektivně trénovat protiopatření na podporu falešné diarizace pomocí tří schémat označování. Potom použijeme předpovědi lokalizace spoof ke zlepšení diarizačního výkonu. Tato první studie odhaluje vysokou složitost úkolu, a to i v omezených scénářích, kde se uvažuje pouze s jedním mluvčím na zvukový soubor a věšteckým množstvím spoofingových metod. Náš kód je k dispozici na https://github.com/nii-yamagishilab/PartialSpoo

Rok
2024
Strany
502-506
Časopis
Proceedings of Interspeech - on-line, roč. 2024, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2024
Konference
Interspeech Conference, Kos, GR
Vydavatel
International Speech Communication Association
Místo
Kos, GR
DOI
BibTeX
@INPROCEEDINGS{FITPUB13323,
   author = "Lin Zhang and Xin Wang and Erica Cooper and Mireia S\'{a}nchez Diez and Nicol\'{a}s Federico Landini and Nicholas Evans and Junichi Yamagishi",
   title = "Spoof Diarization: {"}What Spoofed When{"} in Partially Spoofed Audio",
   pages = "502--506",
   booktitle = "Proceedings of Interspeech 2024",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2024,
   number = 9,
   year = 2024,
   location = "Kos, GR",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2024-1365",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13323"
}
Nahoru