Detail publikace
Description and Analysis of ABC Submission to NIST LRE 2022
Silnova Anna, M.Sc., Ph.D. (UPGM)
SLAVÍČEK, J.
Mošner Ladislav, Ing. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Klčo Michal, Ing.
Peng Junyi (UPGM)
Stafylakis Themos
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
nguage detection, language recognition, embedding extractor, LRE, NIST
Tento článek
shrnuje naše úsilí v NIST Recognition Evaluation 2022, které vyústilo v systémy
poskytující konkurenční výkon. Popisujeme, jaká data jsme použili pro trénování
našich modelů a sledujeme je pomocí "embedding extractors" a "backend
classifiers". Po pokrytí architektury věnujeme pozornost analýze po
vyhodnocení. Porovnáváme různé topologie DNN, různé back-endové klasifikátory a
dopady dat použitých k jejich trénování. Uvádíme také výsledky s XLS-R předtrénované
modelů. Představujeme výkon systémů v "Pevné podmínce", (požadováno použití pouze
předdefinovaných datových sad) a v "Otevřené podmínce" (umožněno použití jakýchkoli dat k trénování systémů).
@inproceedings{BUT185574,
author="MATĚJKA, P. and SILNOVA, A. and SLAVÍČEK, J. and MOŠNER, L. and PLCHOT, O. and KLČO, M. and PENG, J. and STAFYLAKIS, T. and BURGET, L.",
title="Description and Analysis of ABC Submission to NIST LRE 2022",
booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
year="2023",
journal="Proceedings of Interspeech",
volume="2023",
number="08",
pages="511--515",
publisher="International Speech Communication Association",
address="Dublin",
doi="10.21437/Interspeech.2023-1529",
issn="1990-9772",
url="https://www.isca-speech.org/archive/pdfs/interspeech_2023/matejka23_interspeech.pdf"
}