Detail publikace

Diffuse or Confuse: A Diffusion Deepfake Speech Dataset

FIRC, A.; MALINKA, K.; HANÁČEK, P. Diffuse or Confuse: A Diffusion Deepfake Speech Dataset. In 2024 International Conference of the Biometrics Special Interest Group (BIOSIG). Darmstadt: GI - Group for computer science, 2024. p. 1-7. ISBN: 978-3-88579-749-4.

Název česky

Difuze nebo zmatení: Difuzní datová sada pro deepfake řeč

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Firc Anton, Ing. (UITS)
Malinka Kamil, Mgr., Ph.D. (UITS)
Hanáček Petr, doc. Dr. Ing. (UITS)

URL

https://ieeexplore.ieee.org/document/10786752

Klíčová slova

deepfakes, deepfake řeč, dataset, difúze, detekce

Abstrakt

Pokroky v oblasti umělé inteligence a strojového učení výrazně zlepšily
generování syntetické řeči. Tento článek zkoumá difuzní modely, novou metodu pro
vytváření realistické syntetické řeči. Vytváříme difuzní datovou sadu pomocí
dostupných nástrojů a předem natrénovaných modelů. Kromě toho tato studie hodnotí
kvalitu difuzně generovaných deepfake oproti nedifuzním a jejich potenciální
hrozbu pro současné systémy detekce deepfake. Zjištění ukazují, že detekce
deepfakes založených na difúzi je obecně srovnatelná s nedifúzními deepfakes,
s určitou variabilitou v závislosti na architektuře detektoru. Překódování pomocí
difuzních vokodérů vykazuje minimální dopad a celková kvalita řeči je srovnatelná
s nedifuzními metodami.

Rok

2024

Strany

1–7

Sborník

2024 International Conference of the Biometrics Special Interest Group (BIOSIG)

Konference

23rd International Conference of the Biometrics Special Interest Group, Darmstadt, DE

ISBN

978-3-88579-749-4

Vydavatel

GI - Group for computer science

Místo

Darmstadt

DOI

10.1109/BIOSIG61931.2024.10786752

BibTeX

@inproceedings{BUT189345,
  author="Anton {Firc} and Kamil {Malinka} and Petr {Hanáček}",
  title="Diffuse or Confuse: A Diffusion Deepfake Speech Dataset",
  booktitle="2024 International Conference of the Biometrics Special Interest Group (BIOSIG)",
  year="2024",
  pages="1--7",
  publisher="GI - Group for computer science",
  address="Darmstadt",
  doi="10.1109/BIOSIG61931.2024.10786752",
  isbn="978-3-88579-749-4",
  url="https://ieeexplore.ieee.org/document/10786752"
}