Detail publikace
Automatic annotation of online articles based on visual feature classification
Při aplikaci tradičních metod získávání znalostí na dokumenty na WWW typicky narážíme na problém, že běžná webová stránka obsahuje kromě svého hlavního obsahu i množství dodatečných informací různých druhů. Tyto dodatečné informace, jako například navigace nebo reklama, negativně ovlivňují výsledky metod získávání znalostí, například klasifikaci obsahu. V tomto článku představujeme metodu detekce zajímavých oblastí ve stránce, která je inspirována předpokládaným přístupem lidského čtenáře. Nejprve jsou detekovány základní vizuální bloky ve stránce a následně je jejich význam odhadnut na základě jejich vizuálního stylu. V článku popisujeme použitou metodu segmentace stránek, navrhujeme způsob klasifikace bloků na základě jejich vizuálních vlastností a prezentujeme výsledky experimentů na reálných datech.
@ARTICLE{FITPUB9692, author = "Radek Burget and Ivana Burgetov\'{a}", title = "Automatic annotation of online articles based on visual feature classification", pages = "338--360", journal = "International Journal of Intelligent Information and Database Systems", volume = 5, number = 4, year = 2011, ISSN = "1751-5858", doi = "10.1504/IJIIDS.2011.041322", language = "english", url = "https://www.fit.vut.cz/research/publication/9692" }