Detail předmětu
Strojové učení a rozpoznávání
SUR Ak. rok 2023/2024 letní semestr 5 kreditů
Klasifikační úloha a rozpoznávání vzorů, základní schéma klasifikátoru, data a vyhodnocování úspěšnosti jednotlivých metod, statistické rozpoznávání vzorů, extrakce příznaků, baysovské učení, odhad s maximální věrohodnosti (ML), vícerozměrné Gaussovo rozložení, směs gaussovských rozložení (GMM), algoritmus maximalizace očekávání (EM algoritmus), lineární klasifikátory, perceptron, gaussovský lineární klasifikátor, logistická regrese, SVM, dopředné neuronové sítě, konvoluční a rekurentní neuronové sítě, rozpoznávání sekvencí, skryté Markovovy modely (HMM). Aplikace probraných metod na zpracování řeči a obrazu.
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 26 hod. přednášky
- 13 hod. seminář
- 13 hod. projekty
Bodové hodnocení
- 60 bodů závěrečná zkouška (písemná část)
- 15 bodů půlsemestrální test (písemná část)
- 25 bodů projekty
Zajišťuje ústav
Přednášející
Cvičící
Cíle předmětu
Porozumět základům strojového učení se zaměřením na problém klasifikace a rozpoznávání vzorů. Naučit se aplikovat základní algoritmy a metody v této oblasti na problémy rozpoznávání mluvené řeči a obrazu. Pochopit základní principy různých generativních a diskriminativních modelů pro statistického rozpoznávání vzorů. Seznámit se se způsoby vyhodnocování úspěšnosti těchto metod..
Studenti se v rámci předmětu seznámí s problematikou strojového učení aplikovaného na problém klasifikace a rozpoznávání vzorů. Naučí se aplikovat základní algoritmy a modely v této oblasti na vybrané problémy zpracování mluvené řeči a počítačové grafiky. Porozumí rozdílům mezi jednotlivými metodami a dokáží využít výhod existujících klasifikátorů při řešení prakticky orientovaných projektů.
Studenti se seznámí s knihovnami jazyka python zaměřenými na matematické operace, lineární algebru a strojové učení. Zdokonalí se v praktickém užívání matematiky (teorie pravděpodobnosti, statistika, lineární algebra, ...) a programátorských nástrojů. Naučí se řešit týmové projekty.
Proč je předmět vyučován
V současné době jsme svědky velkého rozmachu aplikací využívajících strojové učení či automatické rozpoznávání vzorů. Množí se nám různá zařízení jež je možné ovládat hlasem čí gesty. Digitální foťáky samy detekují obličeje ve snímaném obraze, aby na ně automaticky zaostřily či nějak reagovaly. Virtuální asistenti v mobilních telefonech umí rozpoznat řeč a vyhledat relevantní odpovědi na naše dotazy. Kvalita automatického rozpoznávání identity člověka z hlasové nahrávky nebo fotky obličeje již dnes výrazně přesahuje lidské schopnosti.
V tomto předmětu studenti získají dobrou představu o tom jak tyto technologie fungují. Seznámí se se základním algoritmy a modely, které se z dat samy učí jak rozpoznávat netriviální vzory v audio nahrávkách, obrázcích či jiných signálech a vstupních datech.
Doporučené prerekvizity
- Signály a systémy (ISS)
- Základy počítačové grafiky (IZG)
Požadované prerekvizitní znalosti a dovednosti
Základní znalost běžného matematického formalismu.
Literatura studijní
- Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley & Sons, 2000, ISBN: 978-0-471-05669-0.
Literatura referenční
Osnova přednášek
- Úlohy klasifikace a rozpoznávání, základní schéma klasifikátoru, datové množiny a vyhodnocování úspěšnosti.
- Pravděpodobnostní rozdělení, statistické rozpoznávání vzorů.
- Generativní a diskriminativní modely.
- Vícerozměrné gaussovo rozložení, odhad parametrů s maximální věrohodností.
- Směs gaussovských rozložení (GMM), maximalizace očekávání (EM).
- Extrakce příznaků, Mel-frekvenční kepstrální koeficienty.
- Aplikace pravděpodobnostních modelů ve zpracování řeči a obrazu.
- Lineární klasifikátory, perceptron
- Gaussovský lineární klasifikátor, logistická regrese
- Support vector machines (SVM), jádrové (kernel) funkce
- Neuronové sítě - dopředné, konvoluční a rekurentní
- Skryté markovovy modely (HMM) a jejich aplikace na rozpoznávání řeči.
- Prezentace projektů
Osnova seminářů
Demonstrační cvičení (1h týdně) navazují na přednášku a demonstrují studentům přednášené techniky na datech a reálném kódu. Kód a data pro příklady budou k dispozici studentům.
Osnova ostatní - projekty, práce
- Individuálně zadávané projekty
Průběžná kontrola studia
- Půlsemestrální test - až 15 bodů
- Projekt - až 25 bodů
- Závěrečná písemná zkouška - až 60 bodů
Pro získání bodů ze zkoušky je nutné získat min. 20 bodů, jinak je zkouška hodnocena 0 body.
Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.
Zařazení předmětu ve studijních plánech