Detail publikace
i-vector/HMM Based Text-dependent Speaker Verification System for RedDots Challenge
Sameti Hossein (SHARIF)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Maghsoodi Nooshin (SHARIF)
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT)
Nedávno byl v rámci projektu RedDots zahájen nový sběr dat za účelem vyhodnocení technologie rozpoznávání mluvčího závislých na textu a textu na základě dat z širší populace mluvčích a s realističtějším šumem, kanálem a fonetickou variabilitou. Tento článek analyzuje naše systémy vytvořené pro výzvu RedDots - snahu shromáždit a porovnat počáteční výsledky v této nové sadě hodnotících dat získaných na různých místech. Používáme náš nedávno představený i-vektorový přístup založený na HMM, kde se místo tradičního GMM používá sada HMM specifických pro telefon ke shromažďování dostatečných statistik pro extrakci i-vektorů. Naše systémy jsou trénovány zcela nezávislým způsobem na datech z databází řeči RSR2015 a Libri. Porovnáváme systémy využívající standardní cepstrální funkce a jejich kombinaci s vlastnostmi hrdlových lahví založených na neuronových sítích. Nejlepších výsledků se dosáhne fúzí těchto systémů na úrovni skóre.
@INPROCEEDINGS{FITPUB11268, author = "Hossein Zeinali and Hossein Sameti and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y} and Nooshin Maghsoodi and Pavel Mat\v{e}jka", title = "i-vector/HMM Based Text-dependent Speaker Verification System for RedDots Challenge", pages = "440--444", booktitle = "Proceedings of Interspeech 2016", year = 2016, location = "San Francisco, US", publisher = "International Speech Communication Association", ISBN = "978-1-5108-3313-5", doi = "10.21437/Interspeech.2016-1174", language = "english", url = "https://www.fit.vut.cz/research/publication/11268" }