Detail publikace

Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery

ONDEL YANG, L.; YUSUF, B.; BURGET, L.; SARAÇLAR, M. Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, 2022, vol. 30, no. 5, p. 1902-1917. ISSN: 2329-9290.
Název česky
Neparametrické bayesovské podprostorové modely pro vyhledávání akustických jednotek
Typ
článek v časopise
Jazyk
anglicky
Autoři
ONDEL YANG, L.
Yusuf Bolaji (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
SARAÇLAR, M.
URL
Klíčová slova

Unsupervised learning, non- parametricBayesian models, acoustic unit discovery

Abstrakt

Tato práce zkoumá podprostorové neparametrickémodely pro úkol naučit sadu akustických jednotek z neoznačenýchřečových nahrávek. Omezujeme základní míru Dirichletova- Process mixture s fonetickým podprostorem odhadem z jinýchzdrojových jazyků za účelem vybudování educated prior, čímž si vynutímenaučení akustických jednotek, aby připomínaly telefony známých zdrojových jazyků.Navrhují se dva typy modelů: (i) podprostor HMM(SHMM), který předpokládá, že fonetický podprostor je stejný prokaždý jazyk, (ii) Hierarchický podprostor HMM (H-SHMM)což uvolňuje tento předpoklad a umožňuje mít jazykově specifickýpodprostor odhadovaný na neoznačených cílových datech. Tytomodely jsou aplikovány na 3 jazyky: angličtina, jorubština a mboshia jsou porovnávány s různými konkurenčními akustickými jednotkamizákladní linie objevů. Experimentální výsledky ukazují, že oba podprostormodely předčí ostatní systémy z hlediska kvality shlukování apřesnost segmentace. Navíc pozorujeme, že H-SHMMposkytuje výsledky lepší než SHMM podporující myšlenku, žejazykově specifické priory jsou vhodnější než jazykově agnostické priorypro objev akustické jednotky.

Rok
2022
Strany
1902–1917
Časopis
IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 30, č. 5, ISSN 2329-9290
DOI
UT WoS
000811572000001
EID Scopus
BibTeX
@article{BUT178412,
  author="ONDEL YANG, L. and YUSUF, B. and BURGET, L. and SARAÇLAR, M.",
  title="Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery",
  journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
  year="2022",
  volume="30",
  number="5",
  pages="1902--1917",
  doi="10.1109/TASLP.2022.3171975",
  issn="2329-9290",
  url="https://ieeexplore.ieee.org/document/9767690"
}
Soubory
Nahoru