Detail projektu
DARPA Robust Automatic Transcription of Speech (RATS) - RATS Patrol I
Období řešení: 23. 9. 2010 - 30. 6. 2014
Typ projektu: smluvní výzkum
Kód: D10PC20015
Objednatel: Raytheon BBN Technologies Corp.
rozpoznávání řeči, rozpoznávání mluvčího, rozpoznávání jazyka, detekce klíčových slov, robustnost, šum, přenosové kanály
Existující technologie zpracování řečového signálu jsou nedostačující pro většinu hlučných nebo degradovaných řečových signálů, které jsou důležité pro vojenskou špionáž. Program robustní automatické transkripce řeči vytváří algoritmy a software, které provedou následující úkony na signálech potenciálně obsahujících řeč, které byly získány prostřednictvím komunikačních kanálů, jež jsou extrémně hlučné a/nebo vysoce deformované: detekce řečové aktivity, rozpoznávání jazyka, rozpoznávání mluvčího a detekce klíčových slov.
Andrla Petr, Ing. (UPGM FIT VUT) , spoluřešitel
Cipr Tomáš, Ing. (UPGM FIT VUT) , spoluřešitel
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT) , spoluřešitel
Grézl František, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Chalupníček Kamil, Ing. (UPGM FIT VUT) , spoluřešitel
Otáhalová Sylva (UPGM FIT VUT) , spoluřešitel
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
2017
- PLCHOT Oldřich, MATĚJKA Pavel, SILNOVA Anna, NOVOTNÝ Ondřej, DIEZ Sánchez Mireia, ROHDIN Johan A., GLEMBEK Ondřej, BRÜMMER Niko, SWART Albert du Preez, PRIETO Jesús J., GARCIA Perera Leibny Paola, BUERA Luis, KENNY Patrick, ALAM Jahangir a BHATTACHARYA Gautam. Analysis and Description of ABC Submission to NIST SRE 2016. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1348-1352. ISSN 1990-9772. Detail
- MATĚJKA Pavel, NOVOTNÝ Ondřej, PLCHOT Oldřich, BURGET Lukáš, DIEZ Sánchez Mireia a ČERNOCKÝ Jan. Analysis of Score Normalization in Multilingual Speaker Recognition. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1567-1571. ISSN 1990-9772. Detail
2014
- GLEMBEK Ondřej, MA Jeff, MATĚJKA Pavel, ZHANG Bing, PLCHOT Oldřich, BURGET Lukáš a MATSOUKAS Spyros. Domain adaptation via within-class covariance correction in I-vector based speaker recognition systems. In: Proceedings of ICASSP 2014. Florencie: IEEE Signal Processing Society, 2014, s. 4060-4064. ISBN 978-1-4799-2892-7. Detail
- MATĚJKA Pavel, ZHANG Le, NG Tim, MALLIDI Sri Harish, GLEMBEK Ondřej, MA Jeff a ZHANG Bing. Neural Network Bottleneck Features for Language Identification. In: Proceedings of Odyssey 2014. Joensuu: International Speech Communication Association, 2014, s. 299-304. ISSN 2312-2846. Detail
- BAHARI Mohamad H., DEHAK Najim, VAN hamme Hugo, BURGET Lukáš, ALI Ahmed M. a GLASS Jim. Non-Negative Factor Analysis of Gaussian Mixture Model Weight Adaptation for Language and Dialect Recognition. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 2014, č. 7, s. 1117-1129. ISSN 2329-9290. Detail
- CUMANI Sandro, LAFACE Pietro a PLCHOT Oldřich. On the use of i-vector posterior distributions in Probabilistic Linear Discriminant Analysis. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 22, č. 4, 2014, s. 846-857. ISSN 2329-9290. Detail
- PLCHOT Oldřich, DIEZ Sánchez Mireia, SOUFIFAR Mehdi a BURGET Lukáš. PLLR Features in Language Recognition System for RATS. In: Proceedings of Interspeech 2014. Singapore: International Speech Communication Association, 2014, s. 3048-3051. ISBN 978-1-63439-435-2. Detail
- NG Tim, HSIAO Roger, ZHANG Le, KARAKOS Damianos, MALLIDI Sri Harish, KARAFIÁT Martin, VESELÝ Karel, SZŐKE Igor, ZHANG Bing, NGUYEN Long a SCHWARTZ Richard. Progress in the BBN Keyword Search System for the DARPA RATS Program. In: Proceedings of Interspeech 2014. Singapore: International Speech Communication Association, 2014, s. 959-963. ISBN 978-1-63439-435-2. Detail
- MARTÍNEZ González David, BURGET Lukáš, STAFYLAKIS Themos, LEI Yun, KENNY Patrick a LLEIDA Eduardo. Unscented Transform For Ivector-based Noisy Speaker Recognition. In: Proceedings of ICASSP 2014. Florencie: IEEE Signal Processing Society, 2014, s. 4070-4074. ISBN 978-1-4799-2892-7. Detail
2013
- PLCHOT Oldřich, MATSOUKAS Spyros, MATĚJKA Pavel, DEHAK Najim, MA Jeff, CUMANI Sandro, GLEMBEK Ondřej, HEŘMANSKÝ Hynek, MESGARANI Nima, SOUFIFAR Mehdi Mohammad, THOMAS Samuel, ZHANG Bing a ZHOU Xinhui a kol. Developing A Speaker Identification System For The DARPA RATS Project. In: Proceedings of ICASSP 2013. Vancouver: IEEE Signal Processing Society, 2013, s. 6768-6772. ISBN 978-1-4799-0355-9. Detail
- CUMANI Sandro, BRUMMER Johan Nikolaas Langenhoven, BURGET Lukáš, LAFACE Pietro, PLCHOT Oldřich a VASILAKAKIS Vasileios. Pairwise Discriminative Speaker Verification in the I -Vector Space. IEEE Transactions on Audio, Speech, and Language Processing, roč. 2013, č. 6, s. 1217-1227. ISSN 1558-7916. Detail
- CUMANI Sandro, PLCHOT Oldřich a LAFACE Pietro. Probabilistic Linear Discriminant Analysis Of I-Vector Posterior Distributions. In: Proceedings of ICASSP 2013. Vancouver: IEEE Signal Processing Society, 2013, s. 7644-7648. ISBN 978-1-4799-0355-9. Detail
- SOUFIFAR Mehdi Mohammad, BURGET Lukáš, PLCHOT Oldřich, CUMANI Sandro a ČERNOCKÝ Jan. Regularized Subspace n-Gram Model for Phonotactic iVector Extraction. In: Proceedings of Interspeech 2013. Lyon: International Speech Communication Association, 2013, s. 74-78. ISBN 978-1-62993-443-3. ISSN 2308-457X. Detail
2012
- LEI Yun, BURGET Lukáš a SCHEFFER Nicolas. Bilinear Factor Analysis for iVector Based Speaker Verification. In: Proceedings of Interspeech. Portland, Oregon: International Speech Communication Association, 2012, s. 1-4. ISBN 978-1-62276-759-5. Detail
- BRUMMER Johan Nikolaas Langenhoven, CUMANI Sandro, GLEMBEK Ondřej, KARAFIÁT Martin, MATĚJKA Pavel, PEŠÁN Jan, PLCHOT Oldřich, SOUFIFAR Mehdi Mohammad, DE Villiers Edward a ČERNOCKÝ Jan. Description and analysis of the Brno276 system for LRE2011. In: Proceedings of Odyssey 2012: The Speaker and Language Recognition Workshop. Singapur: International Speech Communication Association, 2012, s. 216-223. ISBN 978-981-07-3093-2. Detail
- NG Tim, ZHANG Bing, NGUYEN Long, MATSOUKAS Spyros, ZHOU Xinhui, MESGARANI Nima, VESELÝ Karel a MATĚJKA Pavel. Developing a Speech Activity Detection System for the DARPA RATS Program. In: Proceedings of Interspeech 2012. Portland, Oregon: International Speech Communication Association, 2012, s. 1-4. ISBN 978-1-62276-759-5. ISSN 1990-9772. Detail
- MATĚJKA Pavel, PLCHOT Oldřich, SOUFIFAR Mehdi Mohammad, GLEMBEK Ondřej, D'HARO Luis Fernando, VESELÝ Karel, GRÉZL František, MA Jeff, MATSOUKAS Spyros a DEHAK Najim. Patrol Team Language Identification System for DARPA RATS P1 Evaluation. In: Proceedings of Interspeech 2012. Portland, Oregon: International Speech Communication Association, 2012, s. 1-4. ISBN 978-1-62276-759-5. ISSN 1990-9772. Detail
- D'HARO Luis Fernando, GLEMBEK Ondřej, PLCHOT Oldřich, MATĚJKA Pavel, SOUFIFAR Mehdi Mohammad, CORDOBA Ricardo a ČERNOCKÝ Jan. Phonotactic Language Recognition using i-vectors and Phoneme Posteriogram Counts. In: Proceedings of Interspeech 2012. Portland, Oregon: International Speech Communication Association, 2012, s. 1-4. ISBN 978-1-62276-759-5. ISSN 1990-9772. Detail
- PLCHOT Oldřich, KARAFIÁT Martin, BRUMMER Johan Nikolaas Langenhoven, GLEMBEK Ondřej, MATĚJKA Pavel, DE Villiers Edward a ČERNOCKÝ Jan. Speaker vectors from Subspace Gaussian Mixture Model as complementary features for Language Identification. In: Proceedings of Odyssey 2012, The Speaker and Language Recognition Workshop. Singapur: International Speech Communication Association, 2012, s. 330-333. ISBN 978-981-07-3093-2. Detail
2011
- SOUFIFAR Mehdi, KOCKMANN Marcel, BURGET Lukáš, PLCHOT Oldřich, GLEMBEK Ondřej a SVENDSEN Torbjorn. iVector Approach to Phonotactic Language Recognition. In: Proceedings of Interspeech 2011. Florence: International Speech Communication Association, 2011, s. 2913-2916. ISBN 978-1-61839-270-1. ISSN 1990-9772. Detail
- MARTÍNEZ González David, PLCHOT Oldřich, BURGET Lukáš, GLEMBEK Ondřej a MATĚJKA Pavel. Language Recognition in iVectors Space. In: Proceedings of Interspeech 2011. Florence: International Speech Communication Association, 2011, s. 861-864. ISBN 978-1-61839-270-1. ISSN 1990-9772. Detail