Detail publikace

Progressive contrastive learning for self-supervised text-independent speaker verification

PENG, J.; ZHANG, C.; ČERNOCKÝ, J.; YU, D. Progressive contrastive learning for self-supervised text-independent speaker verification. Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022). Beijing: International Speech Communication Association, 2022. p. 17-24.
Název česky
Progresivní kontrastivní učení pro samoučící se ověřování mluvčího nezávislé na textu
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Peng Junyi (UPGM)
Zhang Chunlei
Černocký Jan, prof. Dr. Ing. (UPGM)
Yu Dong
URL
Klíčová slova

self-supervised, text-independent, speaker, verification

Abstrakt

Samokontrolované učení reprezentace mluvčího v posledních letech vzbudilo velkou pozornost. Většinapráce je založena na iterativní klasifikaci seskupeníučebních rámců a výkon je citlivýna předem definovaný počet clusterů. Nicméně,počet clusteru je těžké odhadnout, když s ním zacházírozsáhlá neoznačená data. V tomto dokumentu navrhujemealgoritmus progresivního kontrastivního učení (PCL).dynamicky odhadnout počet shluků v každém krokuna základě statistických charakteristik samotných dat,a odhadovaný počet se bude postupně přibližovatse vzrůstajícím počtem pozemských mluvčíchkrok. Konkrétně nejprve aktualizujeme datovou frontu oaktuální rozšířené vzorky. Pak eigendecompositionje zaveden pro odhad počtu mluvčích vaktualizovaná datová fronta. Nakonec přiřadíme data ve frontědo odhadnutého těžiště klastru a zkonstruujte kontrastivníztráta, která podporuje reprezentaci mluvčíhobýt blíže svému těžišti shluku a daleko od ostatních.Experimentální výsledky na VoxCeleb1 prokazují účinnostnašeho navrhovaného PCL ve srovnání se stávajícímipřístupy s vlastním dohledem.

Rok
2022
Strany
17–24
Sborník
Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)
Konference
Odyssey 2022: Workshop o rozpoznávání mluvčího a jazyka, Beijing, CN
Vydavatel
International Speech Communication Association
Místo
Beijing
DOI
BibTeX
@inproceedings{BUT179661,
  author="Junyi {Peng} and Chunlei {Zhang} and Jan {Černocký} and Dong {Yu}",
  title="Progressive contrastive learning for self-supervised text-independent speaker verification",
  booktitle="Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)",
  year="2022",
  pages="17--24",
  publisher="International Speech Communication Association",
  address="Beijing",
  doi="10.21437/Odyssey.2022-3",
  url="https://www.isca-speech.org/archive/pdfs/odyssey_2022/peng22_odyssey.pdf"
}
Soubory
Nahoru