Detail publikace

Progressive contrastive learning for self-supervised text-independent speaker verification

PENG Junyi, ZHANG Chunlei, ČERNOCKÝ Jan a YU Dong. Progressive contrastive learning for self-supervised text-independent speaker verification. In: Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022). Beijing: International Speech Communication Association, 2022, s. 17-24. Dostupné z: https://www.isca-speech.org/archive/pdfs/odyssey_2022/peng22_odyssey.pdf

Název česky

Progresivní kontrastivní učení pro samoučící se ověřování mluvčího nezávislé na textu

Typ

článek ve sborníku konference

Jazyk

angličtina

Autoři

Peng Junyi, Msc. Eng. (UPGM FIT VUT)
Zhang Chunlei (Tencent AI Lab)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Yu Dong (Tencent AI Lab)

URL

Abstrakt

Samokontrolované učení reprezentace mluvčího v posledních letech vzbudilo velkou pozornost. Většina práce je založena na iterativní klasifikaci seskupení učebních rámců a výkon je citlivý na předem definovaný počet clusterů. Nicméně, počet clusteru je těžké odhadnout, když s ním zachází rozsáhlá neoznačená data. V tomto dokumentu navrhujeme algoritmus progresivního kontrastivního učení (PCL). dynamicky odhadnout počet shluků v každém kroku na základě statistických charakteristik samotných dat, a odhadovaný počet se bude postupně přibližovat se vzrůstajícím počtem pozemských mluvčích krok. Konkrétně nejprve aktualizujeme datovou frontu o aktuální rozšířené vzorky. Pak eigendecomposition je zaveden pro odhad počtu mluvčích v aktualizovaná datová fronta. Nakonec přiřadíme data ve frontě do odhadnutého těžiště klastru a zkonstruujte kontrastivní ztráta, která podporuje reprezentaci mluvčího být blíže svému těžišti shluku a daleko od ostatních. Experimentální výsledky na VoxCeleb1 prokazují účinnost našeho navrhovaného PCL ve srovnání se stávajícími přístupy s vlastním dohledem.

Rok

2022

Strany

17-24

Sborník

Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)

Konference

Odyssey 2022: The Speaker and Language Recognition Workshop, Beijing, CN

Vydavatel

International Speech Communication Association

Místo

Beijing, CN

DOI

10.21437/Odyssey.2022-3

BibTeX

@INPROCEEDINGS{FITPUB12835,
   author = "Junyi Peng and Chunlei Zhang and Jan \v{C}ernock\'{y} and Dong Yu",
   title = "Progressive contrastive learning for self-supervised text-independent speaker verification",
   pages = "17--24",
   booktitle = "Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022)",
   year = 2022,
   location = "Beijing, CN",
   publisher = "International Speech Communication Association",
   doi = "10.21437/Odyssey.2022-3",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12835"
}