Detail publikace
Multi-level Sequence Mining Based on GSP
Hlosta Martin, Ing. (UIFS FIT VUT)
Kupčík Jan, Ing. (UIFS FIT VUT)
Zendulka Jaroslav, doc. Ing., CSc. (UIFS FIT VUT)
Hruška Tomáš, prof. Ing., CSc. (UIFS FIT VUT)
dolování víceúrovňových sekvenčních vzorů, GSP, taxonomie
Dolování sekvenčních vzorů je důležitý problém v oblasti dolování z dat, na jehož řešení byla publikována řada algoritmů a optimalizačních technik. GSP, který je jednám z těchto algoritmů, může být využit k dolování sekvenčních vzorů s doplňujícími omezeními. V tomto článku navrhujeme nový algoritmus pro dolování víceúrovňových sekvenčních vzorů založený na GSP. Myšlenka spočívá v tom, že pokud se ve vzoru objeví obecnější prvek, vzor bude mít větší nebo alespoň stejnou podporu než vzor, který by obsahoval příslušný specifičtější prvek. Avšak příliš obecné vzory nejsou zajímavé pro uživatele. Náš algoritmus zobecňování používá selektivní metodu založenou na informační hodnotě vzorů. Umožňuje tak vydolovat více vzorů při stejné hodnotě minimální podpory a objevit nové potenciálně užitečné vzory.
@ARTICLE{FITPUB9874, author = "Michal \v{S}ebek and Martin Hlosta and Jan Kup\v{c}\'{i}k and Jaroslav Zendulka and Tom\'{a}\v{s} Hru\v{s}ka", title = "Multi-level Sequence Mining Based on GSP", pages = "31--38", journal = "Acta Electrotechnica et Informatica", volume = 2012, number = 2, year = 2012, ISSN = "1335-8243", doi = "10.2478/v10198-012-0012-8", language = "english", url = "https://www.fit.vut.cz/research/publication/9874" }