Detail publikace
Resources and Benchmarks for Keyword Search in Spoken Audio From Low-Resource Indian Languages
Kesiraju Santosh (UPGM FIT VUT)
Banka Rohith (IIIT)
Kethireddy Rashmi (IIIT)
Gangashetty Suryakanth V (IIIT)
Tento článek představuje zdroje a srovnávací testy vyvinuté pro vyhledávání podle klíčových slov (KWS) v mluveném zvuku šesti indických jazyků s nízkými zdroji (ze dvou rodin), a to gudžarátštiny, hindštiny, Marathi, Odia, Tamil a Telugu. Současná práce na konstrukci klíčových slov a sestavení srovnávacího měřítka. KWS je inspirována populárním programem IARPA Babel a následnými pracemi na nízkozdrojových systémech. KWS. Klíčová slova jsou konstruována s přihlédnutím k jejich vlastnostem, tj. výskytu, délce a... průměrné zaměnitelnosti a jejich vlivu na hodnotící metriku - term-weighted value (TWV). Využíváme volně dostupných datových sad řeči a zpracováváme je pro vytvoření zdrojů pro KWS, čímž přidáváme hodnotu ke stávajícím řečovým zdrojům. Jsou vytvořeny čtyři systémy KWS založené na ASR a jejich výkonnost je následující analyzovány na všech šesti jazycích s ohledem na tři vlastnosti klíčových slov. Připravená klíčová slova a další související zdroje pro replikaci našich experimentů jsou zpřístupněny veřejnosti. věříme, že analýza bude přínosná i pro ostatní uživatele. a pokyny uvedené v tomto článku pomohou nejen výzkumné komunitě, ale také odborníkům z praxe a odborníkům z praxe. inženýrům při snadném vytváření zdrojů KWS pro novější jazyky, datové sady a scénáře.
@ARTICLE{FITPUB12952, author = "V. Lakshmi Vijaya Nadimpalli and Santosh Kesiraju and Rohith Banka and Rashmi Kethireddy and V Suryakanth Gangashetty", title = "Resources and Benchmarks for Keyword Search in Spoken Audio From Low-Resource Indian Languages", pages = "34789--34799", journal = "IEEE Access", volume = 10, number = 2022, year = 2022, ISSN = "2169-3536", doi = "10.1109/ACCESS.2022.3162854", language = "english", url = "https://www.fit.vut.cz/research/publication/12952" }