Detail projektu
DARPA Robust Automatic Transcription of Speech (RATS) - RATS Patrol II
Období řešení: 23. 2. 2015 - 31. 3. 2017
Typ projektu: smluvní výzkum
Kód: HR0011-15-C-0038
Objednatel: Raytheon BBN Technologies Corp.
rozpoznávání řeči, rozpoznávání mluvčího, rozpoznávání jazyka, detekce klíčových slov, robustnost, šum, přenosové kanály
Existující technologie zpracování řečového signálu jsou nedostačující pro většinu hlučných nebo degradovaných řečových signálů, které jsou důležité pro vojenskou špionáž. Program robustní automatické transkripce řeči vytváří algoritmy a software, které provedou následující úkony na signálech potenciálně obsahujících řeč, které byly získány prostřednictvím komunikačních kanálů, jež jsou extrémně hlučné a/nebo vysoce deformované: detekce řečové aktivity, rozpoznávání jazyka, rozpoznávání mluvčího a detekce klíčových slov.
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Fér Radek, Ing. (UPGM FIT VUT)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Heřmanský Hynek, prof. Ing., Dr.Eng. (UPGM FIT VUT)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Kobes Michal (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Ogawa Tetsuji, Ph.D. (WasUni)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Plchot Oldřich, Ing., Ph.D. (UPGM FIT VUT)
Popková Anna, Ing. (FIT VUT)
Silnova Anna, MSc., Ph.D. (UPGM FIT VUT)
Skácel Miroslav, Ing. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
2017
- MATĚJKA Pavel. Summary report for project "Robust Automatic Speech Transcription" in Year 2017. Brno: Raytheon BBN Technologies Corp., 2017. Detail
2016
- BRUMMER Johan Nikolaas Langenhoven, SWART Albert du Preez, PRIETO Jesús J., GARCIA Perera Leibny Paola, MATĚJKA Pavel, PLCHOT Oldřich, DIEZ Sánchez Mireia, SILNOVA Anna, JIANG Xiaowei, NOVOTNÝ Ondřej, ROHDIN Johan A., GLEMBEK Ondřej, GRÉZL František, BURGET Lukáš, ONDEL Yang Lucas Antoine Francois, PEŠÁN Jan, ČERNOCKÝ Jan, KENNY Patrick, ALAM Jahangir, BHATTACHARYA Gautam a ZEINALI Hossein a kol. ABC NIST SRE 2016 SYSTEM DESCRIPTION. San Diego: National Institute of Standards and Technology, 2016. Detail
- MATĚJKA Pavel, GLEMBEK Ondřej, NOVOTNÝ Ondřej, PLCHOT Oldřich, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. Analysis Of DNN Approaches To Speaker Identification. In: Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016, s. 5100-5104. ISBN 978-1-4799-9988-0. Detail
- NOVOTNÝ Ondřej, MATĚJKA Pavel, PLCHOT Oldřich, GLEMBEK Ondřej, BURGET Lukáš a ČERNOCKÝ Jan. Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 828-832. ISBN 978-1-5108-3313-5. Detail
- NOVOTNÝ Ondřej, MATĚJKA Pavel, GLEMBEK Ondřej, PLCHOT Oldřich, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. Analysis of the DNN-Based SRE Systems in Multi-language Conditions. In: Proceedings of SLT 2016. San Diego: IEEE Signal Processing Society, 2016, s. 199-204. ISBN 978-1-5090-4903-5. Detail
- PLCHOT Oldřich, BURGET Lukáš, ARONOWITZ Hagai a MATĚJKA Pavel. Audio Enhancing With DNN Autoencoder For Speaker Recognition. In: Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016, s. 5090-5094. ISBN 978-1-4799-9988-0. Detail
- PLCHOT Oldřich, MATĚJKA Pavel, FÉR Radek, GLEMBEK Ondřej, NOVOTNÝ Ondřej, PEŠÁN Jan, VESELÝ Karel, ONDEL Yang Lucas Antoine Francois, KARAFIÁT Martin, GRÉZL František, KESIRAJU Santosh, BURGET Lukáš, BRUMMER Johan Nikolaas Langenhoven, SWART Albert du Preez, CUMANI Sandro, MALLIDI Sri Harish a LI Ruizhi. BAT System Description for NIST LRE 2015. In: Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop. Bilbao: International Speech Communication Association, 2016, s. 166-173. ISSN 2312-2846. Detail
- LI Ruizhi, MALLIDI Sri Harish, PLCHOT Oldřich, BURGET Lukáš a DEHAK Najim. Exploiting Hidden-Layer Responses of Deep Neural Networks for Language Recognition. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 3265-3269. ISBN 978-1-5108-3313-5. Detail
- PEŠÁN Jan, BURGET Lukáš a ČERNOCKÝ Jan. Sequence Summarizing Neural Networks for Spoken Language Recognition. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 3285-3289. ISBN 978-1-5108-3313-5. Detail
- MATĚJKA Pavel. Summary report for project "Robust Automatic Speech Transcription" in Year 2016. Brno: Raytheon BBN Technologies Corp., 2016. Detail
2015
- PEŠÁN Jan, BURGET Lukáš, HEŘMANSKÝ Hynek a VESELÝ Karel. DNN derived filters for processing of modulation spectrum of speech. In: Proceedings of Interspeech 2015. Dresden: International Speech Communication Association, 2015, s. 1908-1911. ISBN 978-1-5108-1790-6. ISSN 1990-9772. Detail
- CUMANI Sandro, PLCHOT Oldřich a FÉR Radek. Exploiting i-vector posterior covariances for short-duration language recognition. In: Proceedings of Interspeech 2015. Dresden: International Speech Communication Association, 2015, s. 1002-1006. ISBN 978-1-5108-1790-6. ISSN 1990-9772. Detail
- FÉR Radek, MATĚJKA Pavel, GRÉZL František, PLCHOT Oldřich a ČERNOCKÝ Jan. Multilingual Bottleneck Features for Language Recognition. In: Proceedings of Interspeech 2015. Dresden: International Speech Communication Association, 2015, s. 389-393. ISBN 978-1-5108-1790-6. ISSN 1990-9772. Detail
- MATĚJKA Pavel, PLCHOT Oldřich, NOVOTNÝ Ondřej a FÉR Radek. Summary report for project "Robust Automatic Speech Transcription" in Year 2015. Brno: Raytheon BBN Technologies Corp., 2015. Detail