Detail projektu
DARPA Low Resource Languages for Emergent Incidents (LORELEI) - Exploiting Language Information for Situational Awareness (ELISA)
Období řešení: 1. 9. 2015 - 31. 3. 2020
Typ projektu: smluvní výzkum
Kód: HR001115C0115
Objednatel: University of Southern California
Název česky
DARPA Jazyky s omezenými zdroji pro potenciální krizové situace (LORELEI) - Využití jazykové informace pro situační povědomí (ELISA
Typ
smluvní výzkum
Klíčová slova
zpracování řeči,jazyk, dolování řeči
Abstrakt
Zpracování řeči v našem projektovém návrhu bude řešeno technologiemi, které jsou nízko-zdrojové nebo zkoumající jazyk. Spíše než na dolování obsahu (pro nějž jsou evidentně standardní zdroje jako např. akustický model, jazykový model nebo výslovnostní slovník nedostatečné), se budou zpracovávat data pomocí množství nástrojů na dolování řeči, které minimálně využívají zdrojů cílového jazyka.
Řešitelé
Burget Lukáš, doc. Ing., Ph.D.
(UPGM FIT VUT)
, hlavní řešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Beneš Karel, Ing. (UPGM FIT VUT)
Fér Radek, Ing. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Kocour Martin, Ing. (UPGM FIT VUT)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Skácel Miroslav, Ing. (UPGM FIT VUT)
Žmolíková Kateřina, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Beneš Karel, Ing. (UPGM FIT VUT)
Fér Radek, Ing. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Kocour Martin, Ing. (UPGM FIT VUT)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Skácel Miroslav, Ing. (UPGM FIT VUT)
Žmolíková Kateřina, Ing., Ph.D. (UPGM FIT VUT)
Publikace
2019
- ALAM Jahangir, BOULIANNE Gilles, GLEMBEK Ondřej, LOZANO Díez Alicia, MATĚJKA Pavel, MIZERA Petr, MONTEIRO Joao, MOŠNER Ladislav, NOVOTNÝ Ondřej, PLCHOT Oldřich, ROHDIN Johan A., SILNOVA Anna, SLAVÍČEK Josef, STAFYLAKIS Themos, WANG Shuai a ZEINALI Hossein. ABC NIST SRE 2019 CTS System Description. In: Proceedings of NIST. Sentosa, Singapore: National Institute of Standards and Technology, 2019, s. 1-6. Detail
- MATĚJKA Pavel, PLCHOT Oldřich, ZEINALI Hossein, MOŠNER Ladislav, SILNOVA Anna, BURGET Lukáš, NOVOTNÝ Ondřej a GLEMBEK Ondřej. Analysis of BUT Submission in Far-Field Scenarios of VOiCES 2019 Challenge. In: Proceedings of Interspeech. Graz: International Speech Communication Association, 2019, s. 2448-2452. ISSN 1990-9772. Detail
- BASKAR Murali K., WATANABE Shinji, ASTUDILLO Ramon, HORI Takaaki, BURGET Lukáš a ČERNOCKÝ Jan. Semi-supervised Sequence-to-sequence ASR using Unpaired Speech and Text. In: Proceedings of Interspeech. Graz: International Speech Communication Association, 2019, s. 3790-3794. ISSN 1990-9772. Detail
2018
- ALAM Jahangir, BHATTACHARYA Gautam, BRUMMER Johan Nikolaas Langenhoven, BURGET Lukáš, DIEZ Sánchez Mireia, GLEMBEK Ondřej, KENNY Patrick, KLČO Michal, LANDINI Federico Nicolás, LOZANO Díez Alicia, MATĚJKA Pavel, MONTEIRO Joao, MOŠNER Ladislav, NOVOTNÝ Ondřej, PLCHOT Oldřich, PROFANT Ján, ROHDIN Johan A., SILNOVA Anna, SLAVÍČEK Josef, STAFYLAKIS Themos a ZEINALI Hossein. ABC NIST SRE 2018 SYSTEM DESCRIPTION. In: Proceedings of 2018 NIST SRE Workshop. Athens: National Institute of Standards and Technology, 2018, s. 1-10. Detail
- WIESNER Matthew, LIU Chunxi, ONDEL Yang Lucas Antoine Francois, HARMAN Craig, MANOHAR Vimal, TRMAL Jan, HUANG Zhongqiang, DEHAK Najim a KHUDANPUR Sanjeev. Automatic Speech Recognition and Topic Identification for Almost-Zero-Resource Languages. In: Proceedings of Interspeech. Hyderabad: International Speech Communication Association, 2018, s. 2052-2056. ISSN 1990-9772. Detail
- PULUGUNDLA Bhargav, BASKAR Murali K., KESIRAJU Santosh, EGOROVA Ekaterina, KARAFIÁT Martin, BURGET Lukáš a ČERNOCKÝ Jan. BUT system for low resource Indian language ASR. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 3182-3186. ISSN 1990-9772. Detail
- BENEŠ Karel, KESIRAJU Santosh a BURGET Lukáš. i-vectors in language modeling: An efficient way of domain adaptation for feed-forward models. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 3383-3387. ISSN 1990-9772. Detail
2017
- LIU Chunxi, YANG Jinyi, SUN Ming, KESIRAJU Santosh, ROTT Alena, ONDEL Yang Lucas Antoine Francois, GHAHREMANI Pegah, DEHAK Najim, BURGET Lukáš a KHUDANPUR Sanjeev. An Empirical evaluation of zero resource acoustic unit discovery. In: Proceedings of ICASSP 2017. New Orleans: IEEE Signal Processing Society, 2017, s. 5305-5309. ISBN 978-1-5090-4117-6. Detail
- HANNEMANN Mirko, TRMAL Jan, ONDEL Yang Lucas Antoine Francois, KESIRAJU Santosh a BURGET Lukáš. Bayesian joint-sequence models for grapheme-to-phoneme conversion. In: Proceedings of ICASSP 2017. New Orleans: IEEE Signal Processing Society, 2017, s. 2836-2840. ISBN 978-1-5090-4117-6. Detail
- ONDEL Yang Lucas Antoine Francois, BURGET Lukáš, ČERNOCKÝ Jan a KESIRAJU Santosh. Bayesian phonotactic language model for Acoustic Unit Discovery. In: Proceedings of ICASSP 2017. New Orleans: IEEE Signal Processing Society, 2017, s. 5750-5754. ISBN 978-1-5090-4117-6. Detail
- GLEMBEK Ondřej. Summary report for project Exploiting Language Information for Situational Awareness (ELISA) For year 2017. Brno: University of Southern California, 2017. Detail
- PAPADOPOULOS Pavlos, TRAVADI Ruchir, VAZ Colin, MALANDRAKIS Nikolaos, HERMJAKOB Ulf, POURDAMGHANI Nima, PUST Michael, ZHANG Boliang, PAN Xiaoman, LU Di, LIN Ying, GLEMBEK Ondřej, BASKAR Murali K., KARAFIÁT Martin, BURGET Lukáš, HASEGAWA-JOHNSON Mark, JI Heng, MAY Jonathan, KNIGHT Kevin a NARAYANAN Shrikanth. Team ELISA System for DARPA LORELEI Speech Evaluation 2016. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 2053-2057. ISSN 1990-9772. Detail
- KESIRAJU Santosh, PAPPAGARI Raghavendra, ONDEL Yang Lucas Antoine Francois, BURGET Lukáš, DEHAK Najim, KHUDANPUR Sanjeev, ČERNOCKÝ Jan a GANGASHETTY Suryakanth V. Topic identification of spoken documents using unsupervised acoustic unit discovery. In: Proceedings of ICASSP 2017. New Orleans: IEEE Signal Processing Society, 2017, s. 5745-5749. ISBN 978-1-5090-4117-6. Detail
2016
- KESIRAJU Santosh, BURGET Lukáš, SZŐKE Igor a ČERNOCKÝ Jan. Learning document representations using subspace multinomial model. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 700-704. ISBN 978-1-5108-3313-5. Detail
- GLEMBEK Ondřej. Summary report for project Exploiting Language Information for Situational Awareness (ELISA) For year 2016. Brno: University of Southern California, 2016. Detail
2015
- GLEMBEK Ondřej, KESIRAJU Santosh a ONDEL Yang Lucas Antoine Francois. Summary report for project "ELISA" in Year 2015. Brno: University of Southern California, 2015. Detail