Detail publikace

Text-Based Web Page Classification with Use of Visual Information

BARTÍK, V. Text-Based Web Page Classification with Use of Visual Information. 2010 International Conference on Advances in Social Network Analysis and Mining. Odense: IEEE Computer Society, 2010. p. 416-420. ISBN: 978-0-7695-4138-9.
Název česky
Klasifikace webových stránek založená na textu s využitím vizuální informace
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Klíčová slova

web page classification, term weights, text classification, TF-IDF weight, visual information, visual  blocks

Abstrakt

S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů.

Rok
2010
Strany
416–420
Sborník
2010 International Conference on Advances in Social Network Analysis and Mining
Konference
International Symposium on Open Source Intelligence & Web Mining 2010, Odense, DK
ISBN
978-0-7695-4138-9
Vydavatel
IEEE Computer Society
Místo
Odense
BibTeX
@inproceedings{BUT35625,
  author="Vladimír {Bartík}",
  title="Text-Based Web Page Classification with Use of Visual Information",
  booktitle="2010 International Conference on Advances in Social Network Analysis and Mining",
  year="2010",
  pages="416--420",
  publisher="IEEE Computer Society",
  address="Odense",
  isbn="978-0-7695-4138-9"
}
Nahoru