Detail předmětu
Získávání znalostí z databází
ZZN Ak. rok 2008/2009 zimní semestr 5 kreditů
Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - charakterizace a diskriminace, asociační pravidla, klasifikace a predikce, shlukování. Dolování ve složitě strukturovaných datech. Trendy v získávání znalostí z dat. Řešení projektu zaměřeného na dolování dat využitím dostupného nástroje.
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
- 13 hod. projekty
Zajišťuje ústav
Přednášející
Cvičící
Získané dovednosti, znalosti a kompetence z předmětu
Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází. Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
Cíle předmětu
Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.
Požadované prerekvizitní znalosti a dovednosti
Nejsou žádné prerekvizity.
Literatura referenční
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
Osnova přednášek
- Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie.
- Datové sklady a technologie OLAP pro získávání znalostí z databází.
- Předzpracování dat v procesu získávání znalostí.
- Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
- Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
- Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
- Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
- Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody.
- Další metody shlukování.
- Dolování v proudech dat, časových řadách a posloupnostech.
- Dolování v grafech, Analýzasociálních sítí, multirelační dolování.
- Dolování v objektových, prostorových a multimediálních datech, dolování textu a na webu.
- Aplikace a trendy v získávání znalostí z databází.
Průběžná kontrola studia
Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 25 bodů za bodované aktivity v průběhu semestru.
Metody vyučování
Metody vyučování závisí na způsobu výuky a jsou popsány článkem 7 Studijního a zkušebního řádu VUT.
Kontrolovaná výuka
Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu.
Zařazení předmětu ve studijních plánech