Detail publikace
Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition
Sadhu Samik ()
Heřmanský Hynek, prof. Ing., Dr.Eng. (UPGM FIT VUT)
rozpoznávání řeči, kontinuální učení, rozpoznávání řeči z několika zdrojů, kombinace modelů
Nepřetržité učení se z dat je běžný a nepříliš namáhavý úkol pro lidi, avšak pro strojové učení stále představuje významnou výzvu. Když je natrénovaný model testován v předem neznámých podmínkách, často nezobecňuje dobře. Tento článek navrhuje matematicky motivovaný dynamicky se rozšiřující model s nezávislými částmi, z nichž každá využívala různý soubor dat během trénování. Výsledný model nevykazuje katastrofické zapomínání znalostí získaných z dříve viděných dat a zároveň dokáže integrovat znalosti z nových dat. Během inference dochází k vážené kombinaci modelů na základě odhadnutého pravděpodobnostního rozložení aktivací uvnitř každého modelu realizovaného pomocí neuronové sítě.
@INPROCEEDINGS{FITPUB12945, author = "Martin \v{S}\r{u}stek and Samik Sadhu and Hynek He\v{r}mansk\'{y}", title = "Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition", pages = "1046--1050", booktitle = "Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH", journal = "Proceedings of Interspeech - on-line", volume = 2022, number = 9, year = 2022, location = "Incheon, KR", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2022-11139", language = "english", url = "https://www.fit.vut.cz/research/publication/12945" }