Detail publikace

Multi-level Sequence Mining Based on GSP

ŠEBEK Michal, HLOSTA Martin, KUPČÍK Jan, ZENDULKA Jaroslav a HRUŠKA Tomáš. Multi-level Sequence Mining Based on GSP. Acta Electrotechnica et Informatica, roč. 2012, č. 2, s. 31-38. ISSN 1335-8243.
Název česky
Dolování víceúrovňových sekvenčních vzorů založené na GSP
Typ
článek v časopise
Jazyk
angličtina
Autoři
Klíčová slova

dolování víceúrovňových sekvenčních vzorů, GSP, taxonomie

Abstrakt

Dolování sekvenčních vzorů je důležitý problém v oblasti dolování z dat, na jehož řešení byla publikována řada algoritmů a optimalizačních technik. GSP, který je jednám z těchto algoritmů, může být využit k dolování sekvenčních vzorů s doplňujícími omezeními. V tomto článku navrhujeme nový algoritmus pro dolování víceúrovňových sekvenčních vzorů založený na GSP. Myšlenka spočívá v tom, že pokud se ve vzoru objeví obecnější prvek, vzor bude mít větší nebo alespoň stejnou podporu než vzor, který by obsahoval příslušný specifičtější prvek. Avšak příliš obecné vzory nejsou zajímavé pro uživatele. Náš algoritmus zobecňování používá selektivní metodu založenou na informační hodnotě vzorů. Umožňuje tak vydolovat více vzorů při stejné hodnotě minimální podpory a objevit nové potenciálně užitečné vzory.

Rok
2012
Strany
31-38
Časopis
Acta Electrotechnica et Informatica, roč. 2012, č. 2, ISSN 1335-8243
DOI
BibTeX
@ARTICLE{FITPUB9874,
   author = "Michal \v{S}ebek and Martin Hlosta and Jan Kup\v{c}\'{i}k and Jaroslav Zendulka and Tom\'{a}\v{s} Hru\v{s}ka",
   title = "Multi-level Sequence Mining Based on GSP",
   pages = "31--38",
   journal = "Acta Electrotechnica et Informatica",
   volume = 2012,
   number = 2,
   year = 2012,
   ISSN = "1335-8243",
   doi = "10.2478/v10198-012-0012-8",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/9874"
}
Nahoru