Detail publikace

On Sensitivity of Learning with Limited Labelled Data to the Effects of Randomness: Impact of Interactions and Systematic Choices

PECHER Branislav, SRBA Ivan a BIELIKOVÁ Mária. On Sensitivity of Learning with Limited Labelled Data to the Effects of Randomness: Impact of Interactions and Systematic Choices. In: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing. Miami: Association for Computational Linguistics, 2024, s. 522-556. ISBN 979-8-8917-6164-3.
Název česky
O citlivosti učenia s obmedzenými označenými dátami na efekty náhodnosti: Vplyv interakcií a systematických rozhodnutí
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Pecher Branislav, Ing. (UPGM FIT VUT)
Srba Ivan ()
Bieliková Mária, prof. Ing., PhD. (UPGM FIT VUT)
Abstrakt

Učenie s obmedzenými označenými dátami dokáže efektívne zvládať nedostatok označených vzoriek, avšak je citlivé na účinky nekontrolovanej náhodnosti, ktorú spôsobujú takzvané faktory náhodnosti (t. j. nedeterministické rozhodnutia, ako je výber alebo poradie vzoriek). Navrhujeme a formalizujeme metódu na systematické skúmanie účinkov jednotlivých faktorov náhodnosti, pričom berieme do úvahy aj interakcie (závislosti) medzi nimi. Na tento účel naša metóda zmierňuje účinky ostatných faktorov a zároveň sleduje, ako sa výkonnosť mení naprieč viacerými spusteniami. Pri aplikácii našej metódy na viaceré faktory náhodnosti v prístupoch učenia v kontexte (in-context learning) a doladenia (fine-tuning) na 7 reprezentatívnych úlohách klasifikácie textu a v meta-učení na 3 úlohách sme zistili, že 1) ignorovanie interakcií medzi faktormi náhodnosti v existujúcich prácach viedlo k nekonzistentným záverom kvôli nesprávnemu pripisovaniu účinkov faktorov náhodnosti, ako napríklad nesprávne vyvrátenie citlivosti učenia v kontexte na poradie vzoriek, aj pri náhodnom výbere vzoriek; a 2) Okrem vzájomných interakcií sú účinky faktorov náhodnosti, najmä poradia vzoriek, závislé aj od systematických rozhodnutí, ktoré v existujúcich prácach neboli preskúmané, ako je počet tried, počet vzoriek na triedu alebo výber formátu promptov.

Rok
2024
Strany
522-556
Sborník
Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing
Konference
The 18th Conference of the European Chapter of the Association for Computational Linguistics, St Julian, MT
ISBN
979-8-8917-6164-3
Vydavatel
Association for Computational Linguistics
Místo
Miami, US
DOI
BibTeX
@INPROCEEDINGS{FITPUB12919,
   author = "Branislav Pecher and Ivan Srba and M\'{a}ria Bielikov\'{a}",
   title = "On Sensitivity of Learning with Limited Labelled Data to the Effects of Randomness: Impact of Interactions and Systematic Choices",
   pages = "522--556",
   booktitle = "Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing",
   year = 2024,
   location = "Miami, US",
   publisher = "Association for Computational Linguistics",
   ISBN = "979-8-8917-6164-3",
   doi = "10.18653/v1/2024.emnlp-main.32",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12919"
}
Nahoru