Detail publikace

Progressive contrastive learning for self-supervised text-independent speaker verification

PENG, J.; ZHANG, C.; ČERNOCKÝ, J.; YU, D. Progressive contrastive learning for self-supervised text-independent speaker verification. Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022). Beijing: International Speech Communication Association, 2022. p. 17-24.

Název česky

Progresivní kontrastivní učení pro samoučící se ověřování mluvčího nezávislé na textu

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Peng Junyi (UPGM)
Zhang Chunlei
Černocký Jan, prof. Dr. Ing. (UPGM)
Yu Dong

URL

Klíčová slova

self-supervised, text-independent, speaker, verification

Abstrakt

Samokontrolované učení reprezentace mluvčího v posledních letech vzbudilo velkou pozornost. Většinapráce je založena na iterativní klasifikaci seskupeníučebních rámců a výkon je citlivýna předem definovaný počet clusterů. Nicméně,počet clusteru je těžké odhadnout, když s ním zacházírozsáhlá neoznačená data. V tomto dokumentu navrhujemealgoritmus progresivního kontrastivního učení (PCL).dynamicky odhadnout počet shluků v každém krokuna základě statistických charakteristik samotných dat,a odhadovaný počet se bude postupně přibližovatse vzrůstajícím počtem pozemských mluvčíchkrok. Konkrétně nejprve aktualizujeme datovou frontu oaktuální rozšířené vzorky. Pak eigendecompositionje zaveden pro odhad počtu mluvčích vaktualizovaná datová fronta. Nakonec přiřadíme data ve frontědo odhadnutého těžiště klastru a zkonstruujte kontrastivníztráta, která podporuje reprezentaci mluvčíhobýt blíže svému těžišti shluku a daleko od ostatních.Experimentální výsledky na VoxCeleb1 prokazují účinnostnašeho navrhovaného PCL ve srovnání se stávajícímipřístupy s vlastním dohledem.

Rok

2022

Strany

17–24

Sborník

Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)

Konference

Odyssey 2022: Workshop o rozpoznávání mluvčího a jazyka, Beijing, CN

Vydavatel

International Speech Communication Association

Místo

Beijing

DOI

10.21437/Odyssey.2022-3

BibTeX

@inproceedings{BUT179661,
  author="Junyi {Peng} and Chunlei {Zhang} and Jan {Černocký} and Dong {Yu}",
  title="Progressive contrastive learning for self-supervised text-independent speaker verification",
  booktitle="Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)",
  year="2022",
  pages="17--24",
  publisher="International Speech Communication Association",
  address="Beijing",
  doi="10.21437/Odyssey.2022-3",
  url="https://www.isca-speech.org/archive/pdfs/odyssey_2022/peng22_odyssey.pdf"
}

Soubory

pdf peng_odyssey_2022_progressive.pdf 948 kB