Detail publikace
But System for the Second Dihard Speech Diarization Challenge
Wang Shuai
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Matějka Pavel, Ing., Ph.D.
Žmolíková Kateřina, Ing., Ph.D. (FIT)
Mošner Ladislav, Ing. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Novotný Ondřej, Ing., Ph.D.
Zeinali Hossein, Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Speaker Diarization, Variational Bayes, HMM, DIHARD, CHiME
Tento článek popisuje vítězné systémy vyvinuté společnostíVUT v Brně pro čtyři běhy druhé soutěže DIHARD v diarizaci řeči. Pro běhy 1 a 2 byly systémyzaloženy hlavně na základě provádění aglomeračního hierarchického seskupování(AHC) x-vektorů, následovány dalším x-vektoremshlukování založené na Bayesově skrytém Markovově modelu a variačníInferenci Bayes. Poskytujeme srovnánízlepšení dané každým krokem a sdílíme implementacijádra systému. Pro běhy 3 a 4 snahrávkami z páté soutěže CHIME jsme prozkoumalirůzné přístupy k provádění vícekanálové diarizace anáš nejlepší výkon byl dosažen při aplikaci AHC nafúze pravděpodobnostního lineárního diskriminačního prvku na kanálskóre analýzy.
@inproceedings{BUT163962,
author="Federico Nicolás {Landini} and Shuai {Wang} and Mireia {Diez Sánchez} and Lukáš {Burget} and Pavel {Matějka} and Kateřina {Žmolíková} and Ladislav {Mošner} and Anna {Silnova} and Oldřich {Plchot} and Ondřej {Novotný} and Hossein {Zeinali} and Johan Andréas {Rohdin}",
title="But System for the Second Dihard Speech Diarization Challenge",
booktitle="ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings",
year="2020",
pages="6529--6533",
publisher="IEEE Signal Processing Society",
address="Barcelona",
doi="10.1109/ICASSP40776.2020.9054251",
isbn="978-1-5090-6631-5",
url="https://ieeexplore.ieee.org/document/9054251"
}