Detail publikace
Multi-level Sequence Mining Based on GSP
Hlosta Martin, Ing. (UIFS FIT VUT)
Kupčík Jan, Ing. (UIFS FIT VUT)
Zendulka Jaroslav, doc. Ing., CSc. (UIFS FIT VUT)
Hruška Tomáš, prof. Ing., CSc. (UIFS FIT VUT)
Dolování sekvenčních vzorů, GSP, taxonomie
Dolování sekvenčních vzorů je důležitý problém oblasti dolování z dat a byla publikována řada algoritmů a optimalizačních technik pro řešení tohoto problému. Jedním z představitelů je i algoritmus GSP, který umožňuje dolování sekvenčních vzorů s omezujícími podmínkami. Nad položkami sekvencí mohou existovat taxonomie, které lze využít při dolování sekvenčních vzorů s položkami na různých úrovních hierarchie. Pokud se ve vzoru objeví více obecná položka, má sekvence stejný nebo vyšší minimální podporu než sekvence s více specifickou položkou. To umožní získat nové užitečné vzory. Metoda je založena na algoritmu GSP a podmínky zobecňování jsou založeny na teorii informace.
@INPROCEEDINGS{FITPUB9647, author = "Michal \v{S}ebek and Martin Hlosta and Jan Kup\v{c}\'{i}k and Jaroslav Zendulka and Tom\'{a}\v{s} Hru\v{s}ka", title = "Multi-level Sequence Mining Based on GSP", pages = "185--190", booktitle = "Proceedings of the Eleventh International Conference on Informatics INFORMATICS'2011", series = "1", year = 2011, location = "Ko\v{s}ice, SK", publisher = "Faculty of Electrical Engineering and Informatics, University of Technology Ko\v{s}ice", ISBN = "978-80-89284-94-8", language = "english", url = "https://www.fit.vut.cz/research/publication/9647" }