Detail publikace
KInITVeraAI at SemEval-2023 Task 3: Simple yet Powerful Multilingual Fine-Tuning for Persuasion Techniques Detection
Smoleň Timotej ()
Remiš Tomáš ()
Pecher Branislav, Ing. (UPGM FIT VUT)
Srba Ivan ()
Tento článok predstavuje najlepšie výsledky riešenia úlohy 3 na SemEval 2023 zameranej na podúlohu 3 venovanú detekcii techník presviedčania. Vzhľadom na vysoký multijazyčný charakter vstupných dát a veľký počet 23 predpovedaných štítkov (čo spôsobuje nedostatok označených dát pre niektoré kombinácie jazyka a štítku), sme sa rozhodli pre doladenie predtrénovaných modelov jazyka založených na transformátoroch. Pri vykonávaní viacerých experimentov sme našli najlepšiu konfiguráciu, ktorá pozostáva z veľkého multijazyčného modelu (XLM-RoBERTa large), ktorý je školený spoločne na všetkých vstupných dátach, s dôkladne kalibrovanými prahmi istoty pre viditeľné a prekvapujúce jazyky samostatne. Náš konečný systém sa najlepšie osvedčil na 6 zo 9 jazykov (vrátane dvoch prekvapujúcich jazykov) a dosiahol vysoko konkurencieschopné výsledky na zbývajúcich troch jazykoch.
@INPROCEEDINGS{FITPUB12968, author = "Timo Hrom\'{a}dka and Timotej Smole\v{n} and Tom\'{a}\v{s} Remi\v{s} and Branislav Pecher and Ivan Srba", title = "KInITVeraAI at SemEval-2023 Task 3: Simple yet Powerful Multilingual Fine-Tuning for Persuasion Techniques Detection", pages = "629--637", booktitle = "17th International Workshop on Semantic Evaluation, SemEval 2023 - Proceedings of the Workshop", year = 2023, location = "Toronto, CA", publisher = "Association for Computational Linguistics", ISBN = "978-1-959429-99-9", doi = "10.18653/v1/2023.semeval-1.86", language = "english", url = "https://www.fit.vut.cz/research/publication/12968" }