Detail publikace

Contextual Semi-Supervised Learning: An Approach to Leverage Air-Surveillance and Untranscribed ATC Data in ASR Systems

ZULUAGA-GOMEZ, J.; NIGMATULINA, I.; PRASAD, A.; MOTLÍČEK, P.; VESELÝ, K.; KOCOUR, M.; SZŐKE, I. Contextual Semi-Supervised Learning: An Approach to Leverage Air-Surveillance and Untranscribed ATC Data in ASR Systems. In Proceedings Interspeech 2021. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 3296-3300. ISSN: 1990-9772.
Název česky
Kontextové učení s mírnou supervizí: přístup k využití radarových dat a nepřepsané řeči pro systémy rozpoznávání řeči
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

automatic speech recognition, contextual semisupervisedlearning, air traffic control, air-surveillance data,callsign detection.

Abstrakt

Řízení letového provozu a konkrétně řízení letového provozu (ATC)spoléhají především na hlasovou komunikaci mezi dispečery letového provozu(ATCos) a piloty. Ve většině případů tyto hlasové komunikacedodržují dobře definovanou gramatiku, kterou lze využítv technologiích automatického rozpoznávání řeči (ASR). Volací znak používaný k oslovení letadla je nezbytnou součástí veškeréKomunikace ATCo-pilota. Navrhujeme dvoufázový přístuppřidat kontextové znalosti během polořízeného školenísnížit chybovost systému ASR při rozpoznání částivýrok, který obsahuje volací značku. Zpočátku zastupujeme v aWFST kontextové znalosti (tj. údaje z leteckého dohledu).komunikace ATCo-pilot. Pak během Semi-SupervisedUčení (SSL) kontextové znalosti jsou přidány pomocí secondpassdekódování (tj. mřížkové opětovné bodování). Výsledky ukazují, že neviditelné".domény" (např. údaje z letišť, která nejsou přítomna v kontrolovanýchtréninková data) jsou dále podporovány kontextovým SSL, kdyžve srovnání se samostatným SSL. Pro tento úkol představujemeMíra chybovosti slovní značky (CA-WER) jako hodnotící metrika,který pouze posuzuje výkon ASR mluvené volací značkyve výpovědi. Získali jsme relativní zlepšení CA-WER o 32,1 %.použití SSL s dodatečnými 17,5 % CA-WERvylepšení přidáním kontextových znalostí během SSL na anáročná testovací sada založená na ATC shromážděná z LiveATC.

Rok
2021
Strany
3296–3300
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Konference
22. mezinárodní ISCA konference o hlasové komunikaci (Interspeech 2021), Brno, CZ
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879503078
EID Scopus
BibTeX
@inproceedings{BUT175846,
  author="ZULUAGA-GOMEZ, J. and NIGMATULINA, I. and PRASAD, A. and MOTLÍČEK, P. and VESELÝ, K. and KOCOUR, M. and SZŐKE, I.",
  title="Contextual Semi-Supervised Learning: An Approach to Leverage Air-Surveillance and Untranscribed ATC Data in ASR Systems",
  booktitle="Proceedings Interspeech 2021",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="3296--3300",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-1373",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/zuluagagomez21_interspeech.html"
}
Soubory
Nahoru