Detail projektu
Hlasové technologie v podpoře informační společnosti
Období řešení: 1. 1. 2002 - 31. 12. 2004
Typ projektu: grant
Kód: GA102/02/0124
Agentura: Grantová agentura České republiky
Program:
Název anglicky
Voice technologies for support of information society
Typ
grant
Klíčová slova
zpracování řeči, rozpoznávání, kódování
Abstrakt
Hlasové technologie v podpoře informační společnosti
Řešitelé
Černocký Jan, prof. Dr. Ing.
(UPGM FIT VUT)
, hlavní řešitel
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Grézl František, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Grézl František, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Publikace
2006
- FAPŠO Michal, SCHWARZ Petr, SZŐKE Igor, SMRŽ Pavel, SCHWARZ Milan, ČERNOCKÝ Jan, KARAFIÁT Martin a BURGET Lukáš. Search Engine for Information Retrieval from Speech Records. In: Proceedings of the Third International Seminar on Computer Treatment of Slavic and East European Languages. Bratislava, 2006, s. 100-101. Detail
2005
- ČERNOCKÝ Jan a LAMPA Petr. Teaching signals - making it automatic, making it fun. In: Proc. Radioelektronika 2005. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2005, s. 4. ISBN 80-214-2904-6. Detail
2004
- MATĚJKA Pavel, SZŐKE Igor, SCHWARZ Petr a ČERNOCKÝ Jan. Automatic Language Identification using Phoneme and Automatically Derived Unit Strings. Lecture Notes in Computer Science, roč. 2004, č. 3206, s. 8. ISSN 0302-9743. Detail
- MATĚJKA Pavel, SZŐKE Igor, SCHWARZ Petr a ČERNOCKÝ Jan. Automatic Language Identification using Phoneme and Automatically Derived Unit Strings. In: Proceedings of 7th International Conference Text,Speech and Dialoque 2004. Brno: Springer Verlag, 2004, s. 8. ISBN 3-540-23049-1. Detail
- KARAFIÁT Martin, GRÉZL František a BURGET Lukáš. Combination of MFCC and TRAP features for LVCSR of meeting data. Martigny, 2004. Detail
- BURGET Lukáš. Combination of Speech Features Using Smoothed Heteroscedastic Linear Discriminant Analysis. In: Proc. 8th International Conference on Spoken Language Processing. Jeju island: Sunjin Printing Co,, 2004, s. 2549-2552. Detail
- GRÉZL František. Combinations of TRAP based systems. In: Proc. Seventh International conference on Text, Speech and Dialogue. Brno: Fakulta informatiky MU, 2004, s. 323-330. ISBN 3-540-23049-1. Detail
- MATĚJKA Pavel, ČERNOCKÝ Jan a SIGMUND Milan. Introduction to Automatic Language Identification. In: Conference Proceedings of Radioelektronika 2004. Brno: Slovenská technická univerzita v Bratislavě, 2004, s. 4. ISBN 80-227-2017-8. Detail
- SZŐKE Igor a MOTLÍČEK Petr. Kódování řeči na velmi nízkých bitových rychlostech. GACR 102/02/0124 "Hlasové technologie v podpoře informační společnosti", souhrnný přehled aktivit řešitelských klektivů. Praha: Fakulta elektrotechniky ČVUT, 2004. ISBN 80-01-02957-3. Detail
- BURGET Lukáš. Measurement of Complementarity of Recognition Systems. In: Proc. Seventh International conference on Text, Speech and Dialogue. Lecture Notes in Artificial Intelligence (LNAI) subseries of LNCS series as Volume 3206. Brno: Springer Verlag, 2004, s. 283-290. ISBN 3-540-23049-1. Detail
- MOTLÍČEK Petr. Modelování spektra a časových trajektorií v rozpoznávání řeči. GACR 102/02/0124 "Hlasové technologie v podpoře informační společnosti", souhrnný přehled aktivit řešitelských kolektivů. Praha, 2004. ISBN 80-01-02957-3. Detail
- MOTLÍČEK Petr a ČERNOCKÝ Jan. Multimodal Phoneme Recognition of Meeting Data. In: 7th International Conference, TSD 2004 Brno, Czech Republic, September 2004 Proceedings. Brno: Springer Verlag, 2004, s. 379-384. ISBN 3-540-23049-1. ISSN 0302-9743. Detail
- MOTLÍČEK Petr a ČERNOCKÝ Jan. Multimodal Phoneme Recognition of Meeting Data. Lecture Notes in Computer Science, roč. 2004, č. 3206, s. 6. ISSN 0302-9743. Detail
- FOUSEK Petr, SVOJANOVSKÝ Petr, GRÉZL František a HEŘMANSKÝ Hynek. New Nonsense Syllables Database - Analyses and Preliminary ASR Experiments. In: Proc. 8th International Conference on Spoken Language Processing. Jeju Island: Sunjin Printing Co,, 2004, s. 348-351. ISSN 1225-4111. Detail
- SCHWARZ Petr a MATĚJKA Pavel. Phoneme Recognition from a Long Temporal Context. Martigny, 2004. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Phoneme Recognition from a Long Temporal Context. In: poster at JOINT AMI/PASCAL/IM2/M4 Workshop on Multimodal Interaction and Related Machine Learning Algorithms. Martigny: Insititut Dalle Molle d'Intelligence Artificielle Perceptive, 2004, s. 1-1. Detail
- MOTLÍČEK Petr, BURGET Lukáš a ČERNOCKÝ Jan. Phoneme Recognition of Meetings using Audio-Visual Data. AMI Workshop. Martigny, 2004. Detail
- MATĚJKA Pavel. Review of Automatic Language Identification. In: Proceedings of 10th Conference and Competition STUDENT EEICTT 2004 Volume 2. Brno, 2004, s. 5. ISBN 80-214-2635-7. Detail
- MOTLÍČEK Petr. Segmentace nahrávek živých jednání podle mluvčího. In: Sborník příspěvků a prezentací akce Odborné semináře 2004. REL03V. Brno: Ústav radioelektroniky FEKT VUT v Brně, 2004, s. 28. Detail
- SZŐKE Igor. Speech units automatically generated by ergodic hidden Markov model. In: Proceedings of 10th Conference and Competition STUDENT EEICT 2004. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2004, s. 5. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Towards Lower Error Rates in Phoneme Recognition. Lecture Notes in Computer Science, roč. 2004, č. 3206, s. 8. ISSN 0302-9743. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Towards Lower Error Rates in Phoneme Recognition. In: Proceedings of 7th International Conference Text,Speech and Dialoque 2004. Brno: Springer Verlag, 2004, s. 8. ISBN 3-540-23049-1. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Towards Lower Error Rates In Phoneme Recognition. Lecture Notes in Computer Science, roč. 2004, č. 3206, s. 465-472. ISBN 3-540-23049-1. ISSN 0302-9743. Detail
- MOTLÍČEK Petr. Visual Feature Extreaction for Phoneme Recognition of Meetings. Brno: Ústav počítačové grafiky a multimédií FIT VUT v Brně, 2004. Detail
2003
- MOTLÍČEK Petr a ČERNOCKÝ Jan. All-Pole Modeling for Definition of Speech Features in Aurora3 DSR Task. In: 6th International Conference, TSD 2003 České Budějovice, Czech Republic, September 2003 Proceedings. České Budějovice: Západočeská univerzita v Plzni, 2003, s. 295-300. ISBN 3-540-20024-X. ISSN 0302-9743. Detail
- MOTLÍČEK Petr a ČERNOCKÝ Jan. Autoregressive Modeling based Feature Extraction for Aurora3 DSR Task. In: Proc. EUROSPEECH 2003. Geneva: Insititut Dalle Molle d'Intelligence Artificielle Perceptive, 2003, s. 1801-1804. ISSN 1018-4074. Detail
- MOTLÍČEK Petr. Derivation of TRAPs in Auditory Domain. In: Proceedings of 9th Conference and Competition STUDENT EEICT 2003. Brno: Děkanát FEKT VUT, 2003, s. 598-602. ISBN 80-214-2379-X. Detail
- MOTLÍČEK Petr. Derivation of TRAPs in Auditory Domain. In: Proceedings of the International Conference and Competition. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2003, s. 315-319. ISBN 80-214-2401-X. Detail
- GRÉZL František. Effect of normalization on TRAP based systems in ASR. In: Proc. 13th International scientific conference Radioelektronika 2003. Brno: Ústav radioelektroniky FEKT VUT v Brně, 2003, s. 128-131. ISBN 80-214-2383-8. Detail
- GRÉZL František. Local Time-Frequency Operators in TRAPs For Speech Recognition. In: 6th International Conference, TSD 2003 České Budějovice, Czech Republic, September 2003 Proceedings. České Budějovice: Západočeská univerzita v Plzni, 2003, s. 269-274. ISBN 3-540-20024-X. ISSN 0302-9743. Detail
- MOTLÍČEK Petr. Modeling of Spectra and Temporal Trajectories in Speech Processing. In: Sborník příspěvků a prezentací akce Odborné semináře 2003 . REL02V. Brno: Ústav radioelektroniky FEKT VUT v Brně, 2003, s. 28. Detail
- HEŘMANSKÝ Hynek, MATĚJKA Pavel a SCHWARZ Petr. Použití časové dynamiky k rozpoznávání jazyků z mluvené řeči. In: Proceedings of Language Recognition Workshop 2003. NIST Gaithersburg, MD USA, 2003, s. 56-62. Detail
- MATĚJKA Pavel, SCHWARZ Petr, GRÉZL František a ČERNOCKÝ Jan. Phoneme Classification using Temporal Patterns. In: Proc. 13th International scientific conference Radioelektronika 2003. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2003, s. 1-4. ISBN 80-214-2383-8. Detail
- MATĚJKA Pavel, SCHWARZ Petr, HEŘMANSKÝ Hynek a ČERNOCKÝ Jan. Phoneme Recognition using Temporal Patterns. In: Proc. 6th International Conference Text, Speech and Dialogue, TSD2003. Ceske Budejovice: Springer Verlag, 2003, s. 465-472. ISBN 3-540-20024-X. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Recognition of Phoneme Strings using TRAP Technique. In: Proceedings of 8th International Conference Eurospeech. Geneve: International Speech Communication Association, 2003, s. 1-4. ISSN 1018-4074. Detail
- BURGET Lukáš a ČERNOCKÝ Jan. Recognition of Speech with Non-random Attributes. In: 6th International Conference, TSD 2003 České Budějovice, Czech Republic, September 2003 Proceedings. České Budějovice: Springer Verlag, 2003, s. 6. ISBN 3-540-20024-X. ISSN 0302-9743. Detail
- ČERNOCKÝ Jan. Temporal processing for feature extraction in speech recognition, shortened version of habilitation thesis. Vědecké spisy VUT. Edice Habilitační a inaugurační spisy, sv. 112. Brno: Nakladatelství Vysokého učení technického v Brně VUTIUM, 2003, s. 1-30. ISBN 80-214-2395-1. Detail
- MOTLÍČEK Petr a ČERNOCKÝ Jan. Time-domain based Temporal Processing with Application of. In: Proc. EUROSPEECH 2003. Geneva: Insititut Dalle Molle d'Intelligence Artificielle Perceptive, 2003, s. 821-824. ISSN 1018-4074. Detail
- KARAFIÁT Martin a GRÉZL František. Using MATLAB for Analysis of TRAP system. Radioengineering, roč. 2003, č. 4, s. 38-41. ISSN 1210-2512. Detail
- JENDERKA Petr a VÍCHA Tomáš. Voice Activity Detection in Multimodal Meeting Manager. In: Proceedings of 9th Conference and Competition STUDENT EEICT 2003 Volume 3. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2003, s. 588-592. ISBN 80-214-2379-X. Detail
- SCHWARZ Petr. Would You Like To Make Your Programs Understand Human Voice?. In: Proceedings of 9th Conference STUDENT EEICT 2003. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2003, s. 231-235. ISBN 80-214-2379-X. Detail
2002
- BAUDOIN Genevieve, CAPMAN Francois, ČERNOCKÝ Jan, EL Chami Fadi, CHARBIT Maurice, CHOLLET Gerard a PETROVSKA-DELACRETAZ Dijana. Advances in very low bit-rate speech coding using recognition and synthesis techniques. Lecture Notes in Computer Science, roč. 2002, č. 2448, s. 269-276. ISBN 3-540-44129-8. ISSN 0302-9743. Detail
- MOTLÍČEK Petr. Application of Mel-scale Filter bank for Noise Estimation in Speech Processing. In: 12th International Czech-Slovak Scientific conference Radioelektronika 2002. Bratislava: Slovenská technická univerzita v Bratislavě, 2002, s. 4. ISBN 80-227-1700-2. Detail
- GRÉZL František. Classifiers in speech recognition systems based on TRAPS. In: Proceedings of 8th Conference STUDENT EEICT 2002. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2002, s. 74-77. ISBN 80-214-2116-9. Detail
- KARAFIÁT Martin a ČERNOCKÝ Jan. Context dependent Hidden Markov models in recognition of Czech. In: Proc. 12th International scientific conference Radioelektronika 2002. Bratislava: Slovenská technická univerzita v Bratislavě, 2002, s. 4. ISBN 80-227-1700-2. Detail
- ČERNOCKÝ Jan a KARAFIÁT Martin. Differences between context dependent and context independent Hidden Markov Models for recognition of Czech. In: Proc. of 8th student conference STUDENT EEICT 2002. Brno: Fakulta elektrotechniky VUT, 2002, s. 5. ISBN 80-214-2116-9. Detail
- BURGET Lukáš, MOTLÍČEK Petr, GRÉZL František a JAIN Pratibha. Distributed speech recognition. Radioengineering, roč. 2002, č. 4, s. 12-16. ISSN 1210-2512. Detail
- GARUDADRI Harinath, HEŘMANSKÝ Hynek, MORGAN Nelson, BENITEZ Carmen, BURGET Lukáš, KAJAREKAR Sachin, GRÉZL František, JAIN Pratibha a MOTLÍČEK Petr. Distributed Voice Recognition System Utilizing Multistream Network Feature Processing. San Diego: Qualcomm, 2002. Detail
- MOTLÍČEK Petr a BURGET Lukáš. Efficient Noise Estimation and its Application for Robust Speech Recognition. In: 5th International Conference, TSD 2002 Brno, Czech Republic, September 2002 Proceedings. Berlin: Springer Verlag, 2002, s. 229-236. ISBN 3-540-44129-8. Detail
- MOTLÍČEK Petr. Feature Extraction in Speech Coding and Recognition. Portland: Oregon Graduate Institute of Science and Technology, 2002. Detail
- MATĚJKA Pavel a ČERNOCKÝ Jan. Feature gaussianization in speech recognition. In: Proc. 12th International scientific conference Radioelektronika 2002. Bratislava: Slovenská technická univerzita v Bratislavě, 2002, s. 4. ISBN 80-227-1700-2. Detail
- GRÉZL František, BURGET Lukáš, JAIN Pratibha a ČERNOCKÝ Jan. Improving TRAPS features using LDA. In: Proc. 12th International scientific conference Radioelektronika 2002. Bratislava: Slovenská technická univerzita v Bratislavě, 2002, s. 4. ISBN 80-227-1700-2. Detail
- SCHWARZ Petr a ČERNOCKÝ Jan. Keyword detection in Czech fluent speech. In: Proc. 12th International scientific conference Radioelektronika 2002. Bratislava: Slovenská technická univerzita v Bratislavě, 2002, s. 4. ISBN 80-227-1700-2. Detail
- SCHWARZ Petr. Modifications of Viterbi algorithms for keyword detection. In: Proceedings of 8th Conference STUDENT EEICT 2002. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2002, s. 4. ISBN 80-214-2116-9. Detail
- MOTLÍČEK Petr a BURGET Lukáš. Noise estimation for efficient speech enhancement and robust speech recognition. In: Proc. 7th International Conference on Spoken Language Processing. Denver: International Speech Communication Association, 2002, s. 1033-1036. ISBN 1-876346-42-6. Detail
- MOTLÍČEK Petr. Noise Estimation for Spectral Subtraction in Speech Processing. In: Proceedings of 8th Conference STUDENT EEICT 2002. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2002, s. 4. ISBN 80-214-2116-9. Detail
- BURGET Lukáš, DUPONT Stephane, GARUDADRI Harinath, GRÉZL František, HEŘMANSKÝ Hynek, JAIN Pratibha, KAJAREKAR Sachin a MORGAN Nelson. QUALCOMM-ICSI-OGI Features for ASR. In: Proc. 7th International Conference on Spoken Language Processing. Denver: International Speech Communication Association, 2002, s. 4. ISBN 1-876346-42-6. Detail
- MATĚJKA Pavel, SCHWARZ Petr, KARAFIÁT Martin a ČERNOCKÝ Jan. Some like it Gaussian... In: Proc. 5th International Conference Text, Speech and Dialogue, TSD2002. Lecture notes in artificial intelligence 2448. Berlin: Springer Verlag, 2002, s. 321-324. ISBN 3-540-44129-8. Detail
- ČERNOCKÝ Jan. Temporal processing for feature extraction in speech recognition, habilitation thesis. Brno, 2002. Detail
- ČERNOCKÝ Jan. Units for automatic language independent speech processing. In: Proc. LREC 2002 - workshop on Portability issues in human language technologies. Las Palmas: European Language Resources Association, 2002, s. 7-13. Detail
Produkty
2008
- Fonémový rozpoznáváč založený na dlouhém časovém kontextu, software, 2008
Autoři: Schwarz Petr, Matějka Pavel, Burget Lukáš, Glembek Ondřej Detail