Detail publikace

Text Augmentation for Language Models in High Error Recognition Scenario

BENEŠ, K.; BURGET, L. Text Augmentation for Language Models in High Error Recognition Scenario. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 1872-1876. ISSN: 1990-9772.
Název česky
Augmentace textu pro jazykové modelování ve scénářích s vysokou chybovostí
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

data augmentation, error simulation, languagemodeling, automatic speech recognition

Abstrakt

V tomto článku prozkoumáme několik strategií augmentace dat pro trénování jazykových modelů pro rozpoznávání řeči. Porovnáváme augmentaci na základě globální statistiky chyb s jednou založenou na unigramové statistice chyb ASR a s vyhlazením štítků a jeho vzorkovanou variantou. Kromě toho zkoumáme stabilitu a prediktivní sílu zmatenosti odhadovanou na rozšířených datech. Navzdory tomu, že je triviální, augmentace řízená globální mírou substituce, delece a vkládání dosahuje nejlepších výsledků. Na druhou stranu, i když je související míra zmatenosti stabilní, neposkytuje lepší předpověď konečné míry chyb než ta vanilková. Naše nejlepší schéma augmentace zvyšuje zlepšení WER z druhého průchodu z 1,1 % na 1,9 % absolutně při výzvě CHiMe-6.

Rok
2021
Strany
1872–1876
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Konference
22. mezinárodní ISCA konference o hlasové komunikaci (Interspeech 2021), Brno, CZ
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879501198
EID Scopus
BibTeX
@inproceedings{BUT175841,
  author="Karel {Beneš} and Lukáš {Burget}",
  title="Text Augmentation for Language Models in High Error Recognition Scenario",
  booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="1872--1876",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-627",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/benes21_interspeech.html"
}
Soubory
Nahoru