Detail projektu
Rozpoznávání klíčových slov a akcí v audiovizuálních datech
Období řešení: 26. 10. 2004 - 26. 10. 2006
Typ projektu: grant
Kód: 119/2004
Agentura: CESNET, zájmové sdružení právnických osob
Program:
rozpoznávání řeči, parametrizace, audiovizuální data, audio-video zpracování, vyhledávání klíčových slov
Cílem projektu je automatické zpracování pořizovaných meetingových dat, umožnující uživateli přímé vyhledávání požadovaných událostí v audio/video záznamech podle zvolených kritérií. Aplikačně budou algoritmy také zaměřeny na automatické rozpoznávání řeči s velkým slovníkem. Tvorba navrhovaného robustního a uživatelem použitelného systému závisí na trénování a testování jednotlivých dílčích algoritmů, které jsou však v případě meetingových dat a velkých řečových databází vysoce náročné na výpočetní kapacitu. Projektem navrhovaný cluster je schopen podstatně rozšířit výpočetní kapacitu na naši fakultě a tedy umožnit využití nových metod a postupů v oblasti výzkumu zpracování řečových signálů. Předpokládá se využití clusteru i v jiných oblastech výzkumu v rámci Fakulty informačních technologií.
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Kašpárek Tomáš, Ing., Ph.D. (CVT FIT VUT) , spoluřešitel
Sumec Stanislav, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
2007
- GRÉZL František, KARAFIÁT Martin, KONTÁR Stanislav a ČERNOCKÝ Jan. Probabilistic and bottle-neck features for LVCSR of meetings. In: Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2007). Hononulu: IEEE Signal Processing Society, 2007, s. 757-760. ISBN 1-4244-0728-1. Detail
- ČERNOCKÝ Jan, SZŐKE Igor, FAPŠO Michal, KARAFIÁT Martin, BURGET Lukáš, KOPECKÝ Jiří, GRÉZL František, SCHWARZ Petr, GLEMBEK Ondřej, OPARIN Ilya, SMRŽ Pavel a MATĚJKA Pavel. Search in speech for public security and defense. In: Proc. IEEE Workshop on Signal Processing Applications for Public Security and Forensics, 2007 (SAFE '07). Washington D.C.: IEEE Signal Processing Society, 2007, s. 1-7. ISBN 1-4244-1226-9. Detail
- MATĚJKA Pavel, BURGET Lukáš, SCHWARZ Petr, GLEMBEK Ondřej, KARAFIÁT Martin, GRÉZL František, ČERNOCKÝ Jan, VAN Leeuwen David, BRÜMMER Niko a STRASHEIM Albert. STBU system for the NIST 2006 speaker recognition evaluation. In: Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2007). Honolulu: IEEE Signal Processing Society, 2007, s. 221-224. ISBN 1-4244-0728-1. Detail
2006
- MATĚJKA Pavel, BURGET Lukáš, SCHWARZ Petr a ČERNOCKÝ Jan. Brno University of Technology System for NIST 2005 Language Recognition Evaluation. In: Proceedings of Odyssey 2006: The Speaker and Language Recognition Workshop. San Juan, 2006, s. 57-64. ISBN 1-4244-0472-X. Detail
- BURGET Lukáš, MATĚJKA Pavel a ČERNOCKÝ Jan. Discriminative Training Techniques for Acoustic Language Identification. In: Proceedings of ICASSP 2006. Toulouse, 2006, s. 209-212. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Hierarchical structures of neural networks for phoneme recognition. In: Proceedings of ICASSP 2006. Toulouse, 2006, s. 325-328. Detail
- FAPŠO Michal, SMRŽ Pavel, SCHWARZ Petr, SZŐKE Igor, SCHWARZ Milan, ČERNOCKÝ Jan, KARAFIÁT Martin a BURGET Lukáš. Information Retrieval from Spoken Documents. In: Proceedings of the Seventh International Conference on Intelligent Text Processing and Computational Linguistics (CICLING 2006). Mexico City: Springer Verlag, 2006, s. 410-416. ISBN 3-540-32205-1. Detail
- MATĚJKA Pavel, SCHWARZ Petr, BURGET Lukáš a ČERNOCKÝ Jan. Use of anti-models to furher improve state-of-the-art PRLM language recognition system. In: Proceedings of ICASSP 2006. Toulouse, 2006, s. 197-200. Detail