Detail publikace
Multi-level Sequence Mining Based on GSP
Hlosta Martin, Ing., Ph.D.
Kupčík Jan, Ing.
Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
Hruška Tomáš, prof. Ing., CSc. (UIFS)
dolování víceúrovňových sekvenčních vzorů, GSP, taxonomie
Dolování sekvenčních vzorů je důležitý problém v oblastidolování z dat, na jehož řešení byla publikována řada algoritmů aoptimalizačních technik. GSP, který je jednám z těchto algoritmů, může býtvyužit k dolování sekvenčních vzorů s doplňujícími omezeními. V tomtočlánku navrhujeme nový algoritmus pro dolování víceúrovňových sekvenčních vzorůzaložený na GSP. Myšlenka spočívá v tom, že pokud se ve vzoru objevíobecnější prvek, vzor bude mít větší nebo alespoň stejnou podporu než vzor,který by obsahoval příslušný specifičtější prvek. Avšak příliš obecné vzorynejsou zajímavé pro uživatele. Náš algoritmus zobecňování používá selektivnímetodu založenou na informační hodnotě vzorů. Umožňuje tak vydolovat více vzorůpři stejné hodnotě minimální podpory a objevit nové potenciálně užitečné vzory.
@article{BUT96928,
author="Michal {Šebek} and Martin {Hlosta} and Jan {Kupčík} and Jaroslav {Zendulka} and Tomáš {Hruška}",
title="Multi-level Sequence Mining Based on GSP",
journal="Acta Electrotechnica et Informatica",
year="2012",
volume="2012",
number="2",
pages="31--38",
doi="10.2478/v10198-012-0012-8",
issn="1335-8243",
url="https://www.fit.vut.cz/research/publication/9874/"
}