Detail publikace
A New Approach to Pseudoword Generation
Korpusy tagované na významy slova jsou používány na vyhodnocování algoritmů pro zjednoznačňování slovních významů. Ruční tvorba takových korpusů je velmi náročná. Kvůli tomu byl představen koncept pseudo-slov, která byla integrována do procesu vyhodnocování systému pro zjednoznačňování slovních významů. Tento článek prezentuje nový přístup ke generování pseudo-slov, založený na sémantické blízkosti kandidátních slov pro tvorbu pseudo-slov. Tato nová metoda je porovnána se standardními přístupy a je ukázáno, že dává lepší výsledky. K tvorbě pseudo-slov jsou využity dvě techniky využívající sémantickou blízkost. První využívá ručně vytvořených slovníků jako je WordNet a druhá pak automaticky spočítaná statistická data z velkých korpusů. Na závěr jsou diskutovány výhody a nevýhody našeho přístupu.
@INPROCEEDINGS{FITPUB9193, author = "Lubom\'{i}r Otrusina and Pavel Smr\v{z}", title = "A New Approach to Pseudoword Generation", pages = "1--5", booktitle = "Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10)", year = 2010, location = "Valletta, MT", publisher = "European Language Resources Association", ISBN = "2-9517408-6-7", language = "english", url = "https://www.fit.vut.cz/research/publication/9193" }