Detail předmětu
Získávání znalostí z databází
ZZN Ak. rok 2024/2025 zimní semestr 5 kreditů
Datové sklady. Techniky dolování různých typů znalostí - asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
- 13 hod. projekty
Bodové hodnocení
- 51 bodů závěrečná zkouška (písemná část)
- 15 bodů půlsemestrální test (písemná část)
- 34 bodů projekty
Zajišťuje ústav
Přednášející
Cvičící
Cíle předmětu
Seznámit studenty s metodami a algoritmy modelování dat pro získávání znalostí z nich.
- Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z dat.
- Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
- Student se naučí odborné terminologii v českém i anglickém jazyce.
- Student získá zkušenost s řešením projektů v malém týmu.
- Student se zdokonalí v prezentaci a obhajobě výsledků projektu.
Požadované prerekvizitní znalosti a dovednosti
- Znalost základních kroků procesu získávání znalostí z dat a metod přípravy dat pro krok modelování dat (probráno v předmětu UPA - Ukládání a příprava dat).
- Znalost základů pravděpodobnosti a statistiky.
- Znalost databázových technologií na úrovni bakalářského předmětu.
Literatura studijní
- Skiena, S.S.: The Data Science Design Manual. Springer, 2017, 445 p. ISBN 978-3-319-55443-3.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
- Bishop, C.M: Pattern Recognition and Machine Learning. Springer, 2006, 738 p. ISBN 0387310738.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
- Zendulka, J. a kol.: Získávání znalostí z databází. FIT VUT v Brně, 160 s., 2009. (elektronicky)
Literatura referenční
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
Osnova přednášek
- Datové sklady a technologie OLAP pro získávání znalostí z dat.
- Dolování frekventovaných vzorů a asociací - základní pojmy. Dolování frekventovaných vzorů a asociací - efektivní a škálovatelné metody hledání frekventovaných množin.
- Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
- Prediktivní modelování - základní pojmy, metody klasifikace - rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
- Klasifikace s využitím neuronových sítí. SVM klasifikátor, náhodné lesy.
- Další metody klasifikace a regrese. Hodnocení kvality výsledků klasifikace a regrese.
Shluková analýza - základní pojmy, typy dat při shlukování. - Metody shlukování založené na rozčleňování. Hierarchické metody shlukování. Další metody shlukování. Vyhodnocení kvality shluků.
- Analýza odlehlých hodnot. Dolování v biologických datech.
- Úvod do získávání znalostí z proudů dat a z časových řad.
- Úvod do získávání znalostí v sekvencích, z grafů, dat pohybujících se objektů a multimediálních dat.
- Dolování textu.
- Dolování na webu.
- Další vybraná témata (dolování v datech procesů, doporučovací systémy, dolování v rozlehlých datech).
Osnova ostatní - projekty, práce
- Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z dat.
Průběžná kontrola studia
- Půlsemestrální písemná zkouška - 15 bodů
- Formulace dolovací úlohy - 5 bodů
- Obhajoba projektu - 29 bodů
- Závěrečná zkouška - 51 bodů
- Podmínky zápočtu: prezentace a obhajoba výstupů projektu v předepsaných termínech, min. 24 bodů získaných v průběhu semestru.
- Minimum za závěrečnou zkoušku je 20 bodů.
- Půlsemestrální písemná zkouška, neexistuje náhradní/opravný termín, omluvené neúčasti řeší garant.
- Formulace dolovací úlohy v předepsaném termínu, omluvené neúčasti řeší cvičící.
- Prezentace výsledků projektu v předepsaném termínu, omluvené neúčasti řeší cvičící.
- Závěrečná zkouška, pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body. Omluvenou neúčast řeší garant.
Rozvrh
Den | Typ | Týdny | Místn. | Od | Do | Kapacita | PSK | Skup | Info |
---|---|---|---|---|---|---|---|---|---|
St | přednáška | 1., 2., 3., 4., 7., 8., 10., 11., 12., 13. výuky | E112 | 08:00 | 10:50 | 154 | 1MIT 2MIT | NBIO - NISY NISY xx | Bartík |
St | přednáška | 5., 6., 9. výuky | E112 | 08:00 | 10:50 | 154 | 1MIT 2MIT | NBIO - NISY NISY xx | Burgetová |
Zařazení předmětu ve studijních plánech