Detail publikace
IDIAPers @ Causal News Corpus 2022: Efficient Causal Relation Identification Through a Prompt-based Few-shot Approach
Fajčík Martin, Ing., Ph.D. (UPGM FIT VUT)
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT)
a další
few-shot učení, klasifikátor, identifikace kauzálnych relací, identifikace kauzálnych udalostí, ensembling
V tomto článku popisujeme naši účast na dílčím úkolu 1 CASE-2022, Event Causality Identification with Casual News Corpus. Úlohu identifikace kauzálních vztahů (CRI) řešíme využitím sady jednoduchých, ale komplementárních technik pro jemné ladění jazykových modelů (LM) na malém počtu anotovaných příkladů (tj. konfigurace několika snímků). Při dolaďování LM se řídíme přístupem založeným na promptní predikci, ve kterém je úloha CRI považována za problém maskovaného jazykového modelování (MLM). Tento přístup umožňuje LM nativně předem vyškoleným na problémy MLM přímo generovat textové odpovědi na výzvy specifické pro CRI. Porovnáváme výkon této metody s technikami souboru trénovanými na celém souboru dat. Naše nejvýkonnější podání bylo vyladěno pouze 256 instancemi na třídu, což je 15,7 % všech dostupných údajů, a přesto získalo druhou nejlepší přesnost (0,82), třetí nejlepší přesnost (0,82) a skóre F1 (0,85) velmi blízko tomu, co uvedl vítězný tým (0,86).
@INPROCEEDINGS{FITPUB12839, author = "Sergio Burdisso and Martin Faj\v{c}\'{i}k and Pavel Smr\v{z} and Petr Motl\'{i}\v{c}ek and et al.", title = "IDIAPers @ Causal News Corpus 2022: Efficient Causal Relation Identification Through a Prompt-based Few-shot Approach", pages = "61--69", booktitle = "Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022)", year = 2022, location = "Abu Dhabi, AE", publisher = "Association for Computational Linguistics", ISBN = "978-1-959429-05-0", doi = "10.18653/v1/2022.case-1.9", language = "english", url = "https://www.fit.vut.cz/research/publication/12839" }