Detail publikace
WTF-LOD - A New Resource for Large-Scale NER Evaluation
OTRUSINA Lubomír a SMRŽ Pavel. WTF-LOD - A New Resource for Large-Scale NER Evaluation. In: Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16). Portorož: European Language Resources Association, 2016, s. 3299-3302. ISBN 978-2-9517408-9-1.
Název česky
WTF-LOD - Nový zdroj pro vyhodnocování NER systémů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Abstrakt
Tento článek představuje rozsáhlou datovou sadu pro vyhodnocování systémů pro rozpoznávání jmenných entit. Nejprve pojednává o procesu sběru dat z největších volně dostupných textových korpusů jako jsou Wikipedie, CommonCrawl a ClueWeb09/12. Dále jsou diskutovány ostatní podobné existující korpusy, jako jsou např. WikiLinks a WikiReverse. Naše práce se přednostně zaměřuje na textové dokumenty, deduplikaci dat a pokročilé techniky čištění dat. Prezentovaná datová sada je jednou z největších dostupných datových sad svého druhu a je vhodná pro komplexní vyhodnocování systémů pro zjednoznačňování jmenných entit, včetně mnohoznačných jmen.
Rok
2016
Strany
3299-3302
Sborník
Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16)
Konference
Language Resources and Evaluation Conference 2016, Portorož, SI
ISBN
978-2-9517408-9-1
Vydavatel
European Language Resources Association
Místo
Portorož, SI
UT WoS
000526952503084
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11119, author = "Lubom\'{i}r Otrusina and Pavel Smr\v{z}", title = "WTF-LOD - A New Resource for Large-Scale NER Evaluation", pages = "3299--3302", booktitle = "Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16)", year = 2016, location = "Portoro\v{z}, SI", publisher = "European Language Resources Association", ISBN = "978-2-9517408-9-1", language = "english", url = "https://www.fit.vut.cz/research/publication/11119" }