Detail publikace

Multilingual acoustic modeling for speech recognition based on Subspace Gaussian Mixture Models

BURGET Lukáš, SCHWARZ Petr, AGARWAL Mohit, AKYAZI Pinar, FENG Kai, GHOSHAL Arnab, GLEMBEK Ondřej, GOEL Nagendra K., KARAFIÁT Martin, POVEY Daniel, RASTROW Ariya, ROSE Richard a THOMAS Samuel. Multilingual acoustic modeling for speech recognition based on Subspace Gaussian Mixture Models. In: Proc. International Conference on Acoustictics, Speech, and Signal Processing. Dallas: IEEE Signal Processing Society, 2010, s. 4334-4337. ISBN 978-1-4244-4296-6. ISSN 1520-6149.
Název česky
Multilingvální akustické modelování pro rozpoznávání řeči založené na sub-space Gaussovských modelech
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT)
Agarwal Mohit (IIIT)
Akyazi Pinar (UBOGAZ)
Feng Kai (HKUST)
Ghoshal Arnab (UEDIN)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Goel Nagendra K. (GOVIVACE)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Povey Daniel (JHU)
Rastrow Ariya (JHU)
Rose Richard (MCGILL)
Thomas Samuel (JHU)
URL
Abstrakt

Článek pojednává o multilingválním akustickém modelování pro rozpoznávání řeči založené na sub-space Gaussovských modelech. Reportujeme experimenty založené na rozdílném přístupu k multilingválnímu rozpoznávání řeči. 

Rok
2010
Strany
4334-4337
Časopis
Proc. International Conference on Acoustics, Speech, and Signal Processing, roč. 2010, č. 3, ISSN 1520-6149
Sborník
Proc. International Conference on Acoustictics, Speech, and Signal Processing
Konference
International Conference on Acoustics, Speech, and Signal Processing 2010, Dallas, US
ISBN
978-1-4244-4296-6
Vydavatel
IEEE Signal Processing Society
Místo
Dallas, US
BibTeX
@INPROCEEDINGS{FITPUB9307,
   author = "Luk\'{a}\v{s} Burget and Petr Schwarz and Mohit Agarwal and Pinar Akyazi and Kai Feng and Arnab Ghoshal and Ond\v{r}ej Glembek and K. Nagendra Goel and Martin Karafi\'{a}t and Daniel Povey and Ariya Rastrow and Richard Rose and Samuel Thomas",
   title = "Multilingual acoustic modeling for speech recognition based on Subspace Gaussian Mixture Models",
   pages = "4334--4337",
   booktitle = "Proc. International Conference on Acoustictics, Speech, and Signal Processing",
   journal = "Proc. International Conference on Acoustics, Speech, and Signal Processing",
   volume = 2010,
   number = 3,
   year = 2010,
   location = "Dallas, US",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-4244-4296-6",
   ISSN = "1520-6149",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/9307"
}
Nahoru