Detail publikace
Toroidal Probabilistic Spherical Discriminant Analysis
Brummer Johan Nikolaas Langenhoven, Dr. (AmazonCom)
Swart Albert du Preez (Speechly)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
V rozpoznávání mluvčího, kde jsou namapovány segmenty řeči vložení na jednotkovou hypersféru, dva bodovací back-endy běžně používané, jmenovitě cosinus scoring a PLDA. My máme nedávno navržené PSDA, analog k PLDA, který používá Von Mises-Fisher distribuce místo Gaussianů. V tomto papíru představujeme toroidní PSDA (T-PSDA). Rozšiřuje PSDA o schopnost modelovat variabilitu uvnitř a mezi mluvčími v toroidních subvarietách hypersféry. Jako PLDA a PSDA, model umožňuje skórování v uzavřené formě a uzavřené formě EM aktualizace pro trénink. Na VoxCeleb najdeme T-PSDA accu- energický na stejné úrovni jako kosinové bodování, zatímco přesnost PLDA je nedostatečná rior. Na NIST SRE'21 jsme zjistili, že T-PSDA poskytuje velké přírůstky rasy ve srovnání s kosinovým hodnocením a PLDA.
@INPROCEEDINGS{FITPUB13052, author = "Anna Silnova and Langenhoven Nikolaas Johan Brummer and Preez du Albert Swart and Luk\'{a}\v{s} Burget", title = "Toroidal Probabilistic Spherical Discriminant Analysis", pages = "1--5", booktitle = "Proceedings of ICASSP 2023", year = 2023, location = "Rhodes Island, GR", publisher = "IEEE Signal Processing Society", ISBN = "978-1-7281-6327-7", doi = "10.1109/ICASSP49357.2023.10095580", language = "english", url = "https://www.fit.vut.cz/research/publication/13052" }