Detail předmětu
Moderní metody zpracování řeči
Garant předmětu
Černocký Jan, prof. Dr. Ing. (UPGM)
Jazyk výuky
česky, anglicky
Zakončení
zkouška
Rozsah
- 39 hod. přednášky
Zajišťuje ústav
Literatura studijní
- Moore, B.C.J., : An introduction to the psychology of hearing, Academic Press, 1989
- Jelinek, F.: Statistical Methods for Speech Recognition, MIT Press, 1998
- Fukunaga, K.: Introduction to Statistical Pattern Recognition, Academic Press, 1990
- Vapnik, V. N.: Statistical Learning Theory, Wiley-Interscience, 1998
- Dutoit, T.: An Introduction to Text-To-Speech Synthesis, Kluwer Academic Publishers, 1997
Literatura referenční
- Psutka, J.: Komunikace s s počítačem mluvenou řečí. Academia, Praha, 1995
- Gold, B., Morgan, N.: Speech and audio signal processing, John Wiley & Sons, 2000
- Texty z http://www.fit.vutbr.cz/~cernocky/speech/
Osnova přednášek
- Základní pojmy: signálové vektory a matice parametrů, statistiky.
- Statistické modelování parametrů, modelování času stavovými sekvencemi.
- Skryté Markovovy modely (HMM), struktura, trénování.
- Rozpoznávání řeči pomocí HMM: Viterbiho algoritmus, předávání žetonů (token passing).
- ýslovnostní slovníky a jazykové modely.
- Tvorba řeči a odvozené parametry: LPC, log area ratios (LAR), line spectral pairs (LSP).
- Slyšení řeči a odvozené parametry - Mel-frekvenční cepstrální koeficienty, Perceptual linear prediction (PLP).
- Časové vlastnosti sluchu - RASTA filtrování.
- Trénování výpočtu příznaků na datech: lineární diskriminační analýza.
- Řečové databáze: standardy, obsah, mluvčí, anotace.
- Vokodéry a modelování jejich buzení, multipulsní a statistické modelování (GSM kódování).
- CELP kódování: dlouhodobý prediktor, kódové knihy. Kódování s velmi malým bitovým tokem.
- Současné metody identifikace a ověřování mluvčího.
Zařazení předmětu ve studijních plánech