Detail publikace
Analysis of BUT Submission in Far-Field Scenarios of VOiCES 2019 Challenge
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Zeinali Hossein, Ph.D. (UPGM FIT VUT)
Mošner Ladislav, Ing. (UPGM FIT VUT)
Silnova Anna, MSc., Ph.D. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Tento dokument je post-evaluační analýzou našeho úsilí ve výzvě VOiCES 2019 Speaker Recognition. Všechny systémy v pevném stavu jsou založeny na x-vektorech s různými funkcemi a topologiemi DNN. Jediný nejlepší systém dosahuje minDCF 0,38 (5,25% EER) a fúze 3 systémů přináší minDCF 0,34 (4,87% EER). Analyzujeme také, jak se systémy pro ověřování mluvčích (SV) vyvinuly v posledních několika letech, a výsledky zobrazujeme také na SITW 2016 výzva. EER o stavu jádro-jádro výzvy SITW 2016 klesl z 5,85% na 1,65% u systémových fúzí předložených pro SITW 2016 a VOiCES 2019. Méně omezující otevřená podmínka nám umožnila použít externí data pro přizpůsobení PLDA a dosáhnout dalšího malého zlepšení výkonu. V našem podání do otevřené podmínky jsme použili tři x-vektorové systémy a také jeden systém založený na i-vektorech.
@INPROCEEDINGS{FITPUB12090, author = "Pavel Mat\v{e}jka and Old\v{r}ich Plchot and Hossein Zeinali and Ladislav Mo\v{s}ner and Anna Silnova and Luk\'{a}\v{s} Burget and Ond\v{r}ej Novotn\'{y} and Ond\v{r}ej Glembek", title = "Analysis of BUT Submission in Far-Field Scenarios of VOiCES 2019 Challenge", pages = "2448--2452", booktitle = "Proceedings of Interspeech", journal = "Proceedings of Interspeech - on-line", volume = 2019, number = 9, year = 2019, location = "Graz, AT", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2019-2471", language = "english", url = "https://www.fit.vut.cz/research/publication/12090" }