Detail publikace
Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation
dolování sekvenčních vzorů, generátory syntetických datových sad, taxonomie
Evaluace je důležitou součástí návrhu algoritmů. Algoritmy jsou obvykle evaluovány na reálných a syntetických datových sadách. Reálné datové sady jsou vhodné pro hodnocení vlastností algoritmů v praxi, ale je obtížné změnit datovou sadu tak, aby měla nějaké konkrétní statistické vlastnosti, např. počet vstupních položek. Naproti tomu, vygenerované syntetické datové sady umožňují jednoduše provádět jakékoliv změny hodnoty statistické vlastnosti datové sady při zachování všech ostatních vlastností. V příspěvku prezentujeme postup pro generování databází sekvencí s taxonomiemi pro evaluaci algoritmů pro dolování hierarchických sekvenčních vzorů.
Evaluace je důležitou součástí návrhu algoritmů. Algoritmy jsou obvykle evaluovány na reálných a syntetických datových sadách. Reálné datové sady jsou vhodné pro hodnocení vlastností algoritmů v praxi, ale je obtížné změnit datovou sadu tak, aby měla nějaké konkrétní statistické vlastnosti, např. počet vstupních položek. Naproti tomu, vygenerované syntetické datové sady umožňují jednoduše provádět jakékoliv změny hodnoty statistické vlastnosti datové sady při zachování všech ostatních vlastností. V příspěvku prezentujeme postup pro generování databází sekvencí s taxonomiemi pro evaluaci algoritmů pro dolování hierarchických sekvenčních vzorů.
@INPROCEEDINGS{FITPUB10435, author = "Michal \v{S}ebek and Jaroslav Zendulka", title = "Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation", pages = "289--292", booktitle = "Proceedings of the Twelfth International Conference on Informatics 2013", year = 2013, location = "Ko\v{s}ice, SK", publisher = "The University of Technology Ko\v{s}ice", ISBN = "978-80-8143-127-2", language = "english", url = "https://www.fit.vut.cz/research/publication/10435" }