Detail publikace

Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition

ŠŮSTEK, M.; SADHU, S.; HEŘMANSKÝ, H. Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Incheon: International Speech Communication Association, 2022. p. 1046-1050. ISSN: 1990-9772.
Název česky
Vypořádání se s neznámými testovacími prostředími v kontextu kontinuálního učení a end-to-end automatického rozpoznávače řeči
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

rozpoznávání řeči, kontinuální učení, rozpoznávání řeči z několika zdrojů, kombinace modelů

Abstrakt

Nepřetržité
učení se z dat je běžný a nepříliš namáhavý úkol pro lidi, avšak pro
strojové učení stále představuje významnou výzvu. Když je natrénovaný model testován v předem neznámých podmínkách, často nezobecňuje dobře. Tento článek navrhuje matematicky motivovaný dynamicky se rozšiřující model s nezávislými částmi,
z nichž každá využívala různý soubor dat během trénování. Výsledný
model nevykazuje katastrofické zapomínání znalostí získaných z dříve
viděných dat a zároveň dokáže integrovat znalosti z nových dat. Během
inference dochází k vážené kombinaci modelů na základě odhadnutého
pravděpodobnostního rozložení aktivací uvnitř každého modelu
realizovaného pomocí neuronové sítě.

Rok
2022
Strany
1046–1050
Časopis
Proceedings of Interspeech, roč. 2022, č. 9, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Konference
23. mezinárodní ISCA konference o hlasové komunikaci (Interspeech 2022), Incheon, KR
Vydavatel
International Speech Communication Association
Místo
Incheon
DOI
UT WoS
000900724501045
EID Scopus
BibTeX
@inproceedings{BUT182527,
  author="ŠŮSTEK, M. and SADHU, S. and HEŘMANSKÝ, H.",
  title="Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition",
  booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
  year="2022",
  journal="Proceedings of Interspeech",
  volume="2022",
  number="9",
  pages="1046--1050",
  publisher="International Speech Communication Association",
  address="Incheon",
  doi="10.21437/Interspeech.2022-11139",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/pdfs/interspeech_2022/sustek22_interspeech.pdf"
}
Nahoru