Detail předmětu
Získávání znalostí z databázi
ZZD Ak. rok 2002/2003 zimní semestr
Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - charakterizace a diskriminace, asociační pravidla, klasifikace a predikce, shlukování. Dolování ve složitě strukturovaných datech. Trendy v získávání znalostí z dat. Zpracování a prezentace zadaného tématu.
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
- 13 hod. projekty
Zajišťuje ústav
Získané dovednosti, znalosti a kompetence z předmětu
Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z dat. Hlubší znalosti získají především v oblasti související s tématem disertační práce.
Cíle předmětu
Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami a nástroji používanými pří tomto procesu.
Požadované prerekvizitní znalosti a dovednosti
Nejsou žádné prerekvizity.
Literatura studijní
- Bishop, CH. M.: Pattern Recognition and Machine Learning. Springer, 2006, 738 p. ISBN 978-0-387-31073-2.
- Aggarwal, Ch.C. (ed.): Data Streams: Models and Algorithms. Advances in Database Systems. Springer, 2006, 358 p. ISBN 0387287590.
- Příspěvky v dostupných časopisech a sbornících konferencí (včetně dostupných v ACM Digital library, IEEE Digital library a jiných elektronických zdrojích).
Literatura referenční
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Elsevier Inc., 2012, 703 p. ISBN 978-0-12-381479-1.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p. ISBN 1-55860-901-3.
Osnova přednášek
- Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí.
- Datové sklady a technologie OLAP pro získávání znalostí z dat.
- Předzpracování dat v procesu získávání znalostí.
- Systémy pro dolování dat - specifikace úlohy, dotazovací jazyky pro dolování, architektura systému.
- Dolování charakteristik pojmů (tříd) - charakterizace a diskriminace.
- Dolování asociačních pravidel z transakčních databází.
- Dolování asociačních pravidel z relačních databází a datových skladů.
- Klasifikace - rozhodovací strom, bayesovská klasifikace, využití neuronových sítí.
- Další metody klasifikace. Predikce.
- Shluková analýza.
- Dolování ve složitě strukturovaných datech - dolování v objektových, prostorových a textových databázích.
- Dolování v multimediálních databázích, časových posloupnostech a na WWW.
- Aplikace a trendy v získávání znalostí z dat.
Průběžná kontrola studia
Hodnocení studia je založeno na bodovacím systému. Pro úspěšné absolvování předmětu je nutno dosáhnout 50 bodů.
Kontrolovaná výuka
Přednašky a zpracovaní projektu.