Detail publikace
Detecting English Speech in the Air Traffic Control Voice Communication
Kesiraju Santosh, Ph.D. (UPGM)
Novotný Ondřej, Ing., Ph.D.
Kocour Martin, Ing. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
speech recognition, language detection, x-vectorextractor, acoustic model, air-traffic communication, data collection, text embeddings, Bayesian methods
Vývoj aplikací s podporou hlasu v kokpitu vyžaduje skutečné datové sady s popisky a anotacemi. Založili jsme komunitníplatformu pro shromažďování řeči z řízení letového provozu (ATC), celosvětově v projektu ATCO2. Filtrování ne anglické řeči je jednou z hlavních složek při zpracování datových kanálů. Navrhovaný systín detekce anglického jazyka(ELD) je založen na embeddingech z bayesovského podprostorumultinomického modelu. Trénuje se na síti zmatení slov z ASR systému. Je robustní, snadno se trénuje aje lehký. Dosáhli jsme 0:0439 stejné míry chyb (EER),50% relativní snížení ve srovnání s aktuálním stavem v oboru,akustický systém ELD založený na x-vektorech ve scénáři v doméně.Dále jsme dosáhli EER 0:1352, 33% relativnísnížení ve srovnání s akustickým ELD v neviditelném jazycestav (mimo doménu). Hodnocení plánujeme zveřejnitdatový soubor z projektu ATCO2.
@inproceedings{BUT175844,
author="Igor {Szőke} and Santosh {Kesiraju} and Ondřej {Novotný} and Martin {Kocour} and Karel {Veselý} and Jan {Černocký}",
title="Detecting English Speech in the Air Traffic Control Voice Communication",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="3286--3290",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1033",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/szoke21_interspeech.html"
}