Detail projektu

Multi-lingualita v řečových technologiích

Období řešení: 1. 1. 2020 – 31. 8. 2023

Typ projektu: grant

Kód: LTAIN19087

Agentura: Ministerstvo školství, mládeže a tělovýchovy ČR

Program: INTER-EXCELLENCE - Podprogram INTER-ACTION

Název anglicky
Multi-linguality in speech technologies
Typ
grant
Klíčová slova

multi-lingualita, rozpoznávání řeči, strojové učení, data, přenos učení

Abstrakt

Technologie dolování řečových dat a rozhraní člověk-stroj založené na řeči zažily
v posledním desetiletí významné pokroky a  řada aplikací byla úspěšně
komercializována. Obvykle však fungují správně pouze v  příznivých scénářích -v
jazycích s množstvím dat pro trénování a v relativně čistém prostředí, jako je
kancelář nebo byt. Narychle se rozvíjejících velkých trzích, jako je ten indický,
ztěžují využívání řeči závažné problémy: mnoho jazyků (některé z nich s omezenými
nebo chybějícími zdroji), velmi hlučné podmínky (spousta obchodů se jednoduše
provádí na ulicích indických měst)a variabilní počet mluvčích v konverzaci (od
běžných dvou po celé rodiny). Díky tomu je vývoj automatického rozpoznávání řeči
(automatic speech recognition, ASR), rozpoznávání mluvčího (speaker recognition,
SR) a  diarizace mluvčích (určení, kdo kdy mluvil, speaker diarization, SD)
komplikovaný. V  rámci navrhovaného projektu se dvě zavedené akademické
laboratoře se zkušenostmi s multilingválním ASR, robustním SR a SD: Vysoké učení
technické v Brně (VUT), IIT Madras (IIT-M) spojily s důležitým hráčem na indickém
a globálním trhu s elektronikou -Samsung R&D Institute India-Bangalore (SRI-B),
a  navrhují významný posun vtěchto technologiích, zejména ve vícejazyčném ASR s 
omezenými zdroji. Zatímco VUT a  IIT-M budou poskytovat špičkový výzkum voblasti
dolování řeči (založený mimo jiné na amerických programech IARPA Babel and
Material, vítězství v evaluaci IARPA ASpIRE a v Interspeech 2018 Low Resource
Speech Recognition Challenge for Indian Languages, a na indickém projektu MANDI)
, SRI-B bude poskytovat data, průmyslové vedení a bude se věnovat tvorbě
demonstrátorů.

Řešitelé
Černocký Jan, prof. Dr. Ing. (UPGM) – hlavní řešitel
Egorova Ekaterina, Ing., Ph.D.
Kocour Martin, Ing. (UPGM)
Peng Junyi (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Skácel Miroslav, Ing.
Yusuf Bolaji (UPGM)
Žižka Josef, Ing. (UPGM)
Žmolíková Kateřina, Ing., Ph.D. (FIT)
Publikace

2023

2022

2021

2020

Produkty

2022

Nahoru