Detail publikace
Text-Based Web Page Classification with Use of Visual Information
BARTÍK Vladimír. Text-Based Web Page Classification with Use of Visual Information. In: 2010 International Conference on Advances in Social Network Analysis and Mining. Odense: IEEE Computer Society, 2010, s. 416-420. ISBN 978-0-7695-4138-9.
Název česky
Klasifikace webových stránek založená na textu s využitím vizuální informace
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT)
Abstrakt
S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů.
Rok
2010
Strany
416-420
Sborník
2010 International Conference on Advances in Social Network Analysis and Mining
Konference
International Symposium on Open Source Intelligence & Web Mining 2010, Odense, DK
ISBN
978-0-7695-4138-9
Vydavatel
IEEE Computer Society
Místo
Odense, DK
BibTeX
@INPROCEEDINGS{FITPUB9274, author = "Vladim\'{i}r Bart\'{i}k", title = "Text-Based Web Page Classification with Use of Visual Information", pages = "416--420", booktitle = "2010 International Conference on Advances in Social Network Analysis and Mining", year = 2010, location = "Odense, DK", publisher = "IEEE Computer Society", ISBN = "978-0-7695-4138-9", language = "english", url = "https://www.fit.vut.cz/research/publication/9274" }