Detail publikace
Parameter-Efficient Transfer Learning of Pre-Trained Transformer Models for Speaker Verification Using Adapters
Stafylakis Themos
GU, R.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Mošner Ladislav, Ing. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
Speaker verification, pre-trained model, adapter, fine-tuning, transfer learning
V poslední době zaznamenaly vzestup předtrénované modely Transformer
zájem o oblast zpracování řeči díky jejich velkému úspěchu
v různých následných úkolech. Nicméně většina přístupů dolaďování
aktualizace všech parametrů předtrénovaného modelu, se stane
neúnosné, protože velikost modelu roste a někdy vede k nadměrnému
vhodné pro malé datové soubory. V tomto dokumentu provádíme komplexní
analýzu aplikace parametricky efektivního přenosového učení (PETL)
metody ke snížení požadovaných naučitelných parametrů pro přizpůsobení
k úkolům ověřování mluvčího. Konkrétně při dolaďování
procesu jsou předtrénované modely zmrazené a pouze lehké
moduly vložené do každého bloku transformátoru jsou trénovatelné (metoda
známé jako adaptéry). Navíc ke zvýšení výkonu v křížovém
Jazykový scénář s nízkými zdroji, model Transformer je dále
vyladili na velké střední datové sadě před jejím přímým doladěním
na malém datovém souboru. Při aktualizaci méně než 4 % parametrů (naše
navrhované) metody založené na PETL dosahují srovnatelných výkonů
s metodami úplného jemného doladění (Vox1-O: 0,55 %, Vox1-E: 0,82 %,
Voxl-H: 1,73 %).
@inproceedings{BUT185200,
author="PENG, J. and STAFYLAKIS, T. and GU, R. and PLCHOT, O. and MOŠNER, L. and BURGET, L. and ČERNOCKÝ, J.",
title="Parameter-Efficient Transfer Learning of Pre-Trained Transformer Models for Speaker Verification Using Adapters",
booktitle="ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings",
year="2023",
pages="1--5",
publisher="IEEE Signal Processing Society",
address="Rhodes Island",
doi="10.1109/ICASSP49357.2023.10094795",
isbn="978-1-7281-6327-7",
url="https://ieeexplore.ieee.org/document/10094795"
}