Detail projektu
NTT - Speech enhancement front-end for robust automatic speech recognition with large amount of training data
Období řešení: 1. 1. 2019 - 31. 12. 2019
Typ projektu: smluvní výzkum
Objednatel: NTT Corporation
Název česky
NTT - Parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat
Typ
smluvní výzkum
Klíčová slova
rozpoznávání řeči, odolnost, velký objem dat,
Abstrakt
Cílem společného výzkumu je vyvinout technologie parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat v rámci spolupráce mezi VUT a NTT. Práce je založena na nízkodimenzionálních reprezentacích dat (embeddings) produkovaných neuronovými sítěmi v různých místech řetězce zpracování.
Řešitelé
Žmolíková Kateřina, Ing., Ph.D.
(UPGM FIT VUT)
, hlavní řešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Publikace
2020
- ROHDIN Johan A., SILNOVA Anna, DIEZ Sánchez Mireia, PLCHOT Oldřich, MATĚJKA Pavel, BURGET Lukáš a GLEMBEK Ondřej. End-to-end DNN based text-independent speaker recognition for long and short utterances. Computer Speech and Language, roč. 2020, č. 59, s. 22-35. ISSN 0885-2308. Detail
2019
- DELCROIX Marc, ŽMOLÍKOVÁ Kateřina, OCHIAI Tsubasa, KINOSHITA Keisuke, ARAKI Shoko a NAKATANI Tomohiro. Compact Network for Speakerbeam Target Speaker Extraction. In: Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019, s. 6965-6969. ISBN 978-1-5386-4658-8. Detail
- DELCROIX Marc, ŽMOLÍKOVÁ Kateřina, OCHIAI Tsubasa, KINOSHITA Keisuke, ARAKI Shoko a NAKATANI Tomohiro. Evaluation of SpeakerBeam target speech extraction in real noisy and reverberant conditions. THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN, roč. 2019, č. 2, s. 1-2. ISSN 0369-4232. Detail