Detail publikace
Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery
Unsupervised learning, non- parametricBayesian models, acoustic unit discovery
Tato práce zkoumá podprostorové neparametrickémodely pro úkol naučit sadu akustických jednotek z neoznačenýchřečových nahrávek. Omezujeme základní míru Dirichletova- Process mixture s fonetickým podprostorem odhadem z jinýchzdrojových jazyků za účelem vybudování educated prior, čímž si vynutímenaučení akustických jednotek, aby připomínaly telefony známých zdrojových jazyků.Navrhují se dva typy modelů: (i) podprostor HMM(SHMM), který předpokládá, že fonetický podprostor je stejný prokaždý jazyk, (ii) Hierarchický podprostor HMM (H-SHMM)což uvolňuje tento předpoklad a umožňuje mít jazykově specifickýpodprostor odhadovaný na neoznačených cílových datech. Tytomodely jsou aplikovány na 3 jazyky: angličtina, jorubština a mboshia jsou porovnávány s různými konkurenčními akustickými jednotkamizákladní linie objevů. Experimentální výsledky ukazují, že oba podprostormodely předčí ostatní systémy z hlediska kvality shlukování apřesnost segmentace. Navíc pozorujeme, že H-SHMMposkytuje výsledky lepší než SHMM podporující myšlenku, žejazykově specifické priory jsou vhodnější než jazykově agnostické priorypro objev akustické jednotky.
@article{BUT178412,
author="ONDEL YANG, L. and YUSUF, B. and BURGET, L. and SARAÇLAR, M.",
title="Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery",
journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
year="2022",
volume="30",
number="5",
pages="1902--1917",
doi="10.1109/TASLP.2022.3171975",
issn="2329-9290",
url="https://ieeexplore.ieee.org/document/9767690"
}