Detail publikace

WTF-LOD - A New Resource for Large-Scale NER Evaluation

OTRUSINA Lubomír a SMRŽ Pavel. WTF-LOD - A New Resource for Large-Scale NER Evaluation. In: Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16). Portorož: European Language Resources Association, 2016, s. 3299-3302. ISBN 978-2-9517408-9-1.
Název česky
WTF-LOD - Nový zdroj pro vyhodnocování NER systémů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Abstrakt

Tento článek představuje rozsáhlou datovou sadu pro vyhodnocování systémů pro rozpoznávání jmenných entit. Nejprve pojednává o procesu sběru dat z největších volně dostupných textových korpusů jako jsou Wikipedie, CommonCrawl a ClueWeb09/12. Dále jsou diskutovány ostatní podobné existující korpusy, jako jsou např. WikiLinks a WikiReverse. Naše práce se přednostně zaměřuje na textové dokumenty, deduplikaci dat a pokročilé techniky čištění dat. Prezentovaná datová sada je jednou z největších dostupných datových sad svého druhu a je vhodná pro komplexní vyhodnocování systémů pro zjednoznačňování jmenných entit, včetně mnohoznačných jmen.

Rok
2016
Strany
3299-3302
Sborník
Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16)
Konference
Language Resources and Evaluation Conference 2016, Portorož, SI
ISBN
978-2-9517408-9-1
Vydavatel
European Language Resources Association
Místo
Portorož, SI
UT WoS
000526952503084
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11119,
   author = "Lubom\'{i}r Otrusina and Pavel Smr\v{z}",
   title = "WTF-LOD - A New Resource for Large-Scale NER Evaluation",
   pages = "3299--3302",
   booktitle = "Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16)",
   year = 2016,
   location = "Portoro\v{z}, SI",
   publisher = "European Language Resources Association",
   ISBN = "978-2-9517408-9-1",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11119"
}
Nahoru