Detail publikace
Progressive contrastive learning for self-supervised text-independent speaker verification
self-supervised, text-independent, speaker, verification
Samokontrolované učení reprezentace mluvčího v posledních letech vzbudilo velkou pozornost. Většinapráce je založena na iterativní klasifikaci seskupeníučebních rámců a výkon je citlivýna předem definovaný počet clusterů. Nicméně,počet clusteru je těžké odhadnout, když s ním zacházírozsáhlá neoznačená data. V tomto dokumentu navrhujemealgoritmus progresivního kontrastivního učení (PCL).dynamicky odhadnout počet shluků v každém krokuna základě statistických charakteristik samotných dat,a odhadovaný počet se bude postupně přibližovatse vzrůstajícím počtem pozemských mluvčíchkrok. Konkrétně nejprve aktualizujeme datovou frontu oaktuální rozšířené vzorky. Pak eigendecompositionje zaveden pro odhad počtu mluvčích vaktualizovaná datová fronta. Nakonec přiřadíme data ve frontědo odhadnutého těžiště klastru a zkonstruujte kontrastivníztráta, která podporuje reprezentaci mluvčíhobýt blíže svému těžišti shluku a daleko od ostatních.Experimentální výsledky na VoxCeleb1 prokazují účinnostnašeho navrhovaného PCL ve srovnání se stávajícímipřístupy s vlastním dohledem.
@inproceedings{BUT179661,
author="Junyi {Peng} and Chunlei {Zhang} and Jan {Černocký} and Dong {Yu}",
title="Progressive contrastive learning for self-supervised text-independent speaker verification",
booktitle="Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)",
year="2022",
pages="17--24",
publisher="International Speech Communication Association",
address="Beijing",
doi="10.21437/Odyssey.2022-3",
url="https://www.isca-speech.org/archive/pdfs/odyssey_2022/peng22_odyssey.pdf"
}