Detail publikace

Resources and Benchmarks for Keyword Search in Spoken Audio From Low-Resource Indian Languages

NADIMPALLI Vijaya Lakshmi V., KESIRAJU Santosh, BANKA Rohith, KETHIREDDY Rashmi a GANGASHETTY Suryakanth V. Resources and Benchmarks for Keyword Search in Spoken Audio From Low-Resource Indian Languages. IEEE Access, roč. 10, č. 2022, 2022, s. 34789-34799. ISSN 2169-3536. Dostupné z: https://ieeexplore.ieee.org/document/9743904

Název česky

Zdroje a srovnání pro vyhledávání klíčových slov v mluveném audiu indických jazyků s malým množstvím zdrojů

Typ

článek v časopise

Jazyk

angličtina

Autoři

Nadimpalli Vijaya Lakshmi V. (IIIT)
Kesiraju Santosh (UPGM FIT VUT)
Banka Rohith (IIIT)
Kethireddy Rashmi (IIIT)
Gangashetty Suryakanth V (IIIT)

URL

Abstrakt

Tento článek představuje zdroje a srovnávací testy vyvinuté pro vyhledávání podle klíčových slov (KWS) v mluveném zvuku šesti indických jazyků s nízkými zdroji (ze dvou rodin), a to gudžarátštiny, hindštiny, Marathi, Odia, Tamil a Telugu. Současná práce na konstrukci klíčových slov a sestavení srovnávacího měřítka. KWS je inspirována populárním programem IARPA Babel a následnými pracemi na nízkozdrojových systémech. KWS. Klíčová slova jsou konstruována s přihlédnutím k jejich vlastnostem, tj. výskytu, délce a... průměrné zaměnitelnosti a jejich vlivu na hodnotící metriku - term-weighted value (TWV). Využíváme volně dostupných datových sad řeči a zpracováváme je pro vytvoření zdrojů pro KWS, čímž přidáváme hodnotu ke stávajícím řečovým zdrojům. Jsou vytvořeny čtyři systémy KWS založené na ASR a jejich výkonnost je následující analyzovány na všech šesti jazycích s ohledem na tři vlastnosti klíčových slov. Připravená klíčová slova a další související zdroje pro replikaci našich experimentů jsou zpřístupněny veřejnosti. věříme, že analýza bude přínosná i pro ostatní uživatele. a pokyny uvedené v tomto článku pomohou nejen výzkumné komunitě, ale také odborníkům z praxe a odborníkům z praxe. inženýrům při snadném vytváření zdrojů KWS pro novější jazyky, datové sady a scénáře.

Rok

2022

Strany

34789-34799

Časopis

IEEE Access, roč. 10, č. 2022, ISSN 2169-3536

Vydavatel

Institute of Electrical and Electronics Engineers

DOI

10.1109/ACCESS.2022.3162854

UT WoS

000778878900001

EID Scopus

2-s2.0-85127473918

BibTeX

@ARTICLE{FITPUB12952,
   author = "V. Lakshmi Vijaya Nadimpalli and Santosh Kesiraju and Rohith Banka and Rashmi Kethireddy and V Suryakanth Gangashetty",
   title = "Resources and Benchmarks for Keyword Search in Spoken Audio From Low-Resource Indian Languages",
   pages = "34789--34799",
   journal = "IEEE Access",
   volume = 10,
   number = 2022,
   year = 2022,
   ISSN = "2169-3536",
   doi = "10.1109/ACCESS.2022.3162854",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12952"
}