Detail publikace

Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition

ŠŮSTEK, M.; SADHU, S.; HEŘMANSKÝ, H. Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Incheon: International Speech Communication Association, 2022. p. 1046-1050. ISSN: 1990-9772.

Název česky

Vypořádání se s neznámými testovacími prostředími v kontextu kontinuálního učení a end-to-end automatického rozpoznávače řeči

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Šůstek Martin, Ing. (UPGM)
SADHU, S.
Heřmanský Hynek, prof. Ing., Dr. Eng. (UPGM)

URL

https://www.isca-speech.org/archive/pdfs/interspeech_2022/sustek22_interspeech.pdf

Klíčová slova

rozpoznávání řeči, kontinuální učení, rozpoznávání řeči z několika zdrojů, kombinace modelů

Abstrakt

Nepřetržité
učení se z dat je běžný a nepříliš namáhavý úkol pro lidi, avšak pro
strojové učení stále představuje významnou výzvu. Když je natrénovaný model testován v předem neznámých podmínkách, často nezobecňuje dobře. Tento článek navrhuje matematicky motivovaný dynamicky se rozšiřující model s nezávislými částmi,
z nichž každá využívala různý soubor dat během trénování. Výsledný
model nevykazuje katastrofické zapomínání znalostí získaných z dříve
viděných dat a zároveň dokáže integrovat znalosti z nových dat. Během
inference dochází k vážené kombinaci modelů na základě odhadnutého
pravděpodobnostního rozložení aktivací uvnitř každého modelu
realizovaného pomocí neuronové sítě.

Rok

2022

Strany

1046–1050

Časopis

Proceedings of Interspeech, roč. 2022, č. 9, ISSN 1990-9772

Sborník

Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH

Konference

23. mezinárodní ISCA konference o hlasové komunikaci (Interspeech 2022), Incheon, KR

Vydavatel

International Speech Communication Association

Místo

Incheon

DOI

10.21437/Interspeech.2022-11139

UT WoS

000900724501045

EID Scopus

2-s2.0-85140076092

BibTeX

@inproceedings{BUT182527,
  author="ŠŮSTEK, M. and SADHU, S. and HEŘMANSKÝ, H.",
  title="Dealing with Unknowns in Continual Learning for End-to-end Automatic Speech Recognition",
  booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
  year="2022",
  journal="Proceedings of Interspeech",
  volume="2022",
  number="9",
  pages="1046--1050",
  publisher="International Speech Communication Association",
  address="Incheon",
  doi="10.21437/Interspeech.2022-11139",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/pdfs/interspeech_2022/sustek22_interspeech.pdf"
}