Detail publikace

Comprehensive Multiparametric Analysis of Human Deepfake Speech Recognition

MALINKA Kamil, FIRC Anton, ŠALKO Milan, PRUDKÝ Daniel, RADAČOVSKÁ Karolína a HANÁČEK Petr. Comprehensive Multiparametric Analysis of Human Deepfake Speech Recognition. Eurasip Journal on Image and Video Processing, roč. 2024, č. 1, s. 1-25. ISSN 1687-5281. Dostupné z: https://jivp-eurasipjournals.springeropen.com/articles/10.1186/s13640-024-00641-4
Název česky
Komplexní multiparametrická analýza hloubkového rozpoznávání lidské řeči
Typ
článek v časopise
Jazyk
angličtina
Autoři
Malinka Kamil, Mgr., Ph.D. (UITS FIT VUT)
Firc Anton, Ing. (UITS FIT VUT)
Šalko Milan, Ing. (UITS FIT VUT)
Prudký Daniel, Bc. (FIT VUT)
Radačovská Karolína, Bc. (FIT VUT)
Hanáček Petr, doc. Dr. Ing. (UITS FIT VUT)
URL
Klíčová slova

Deepfake, Syntetická řeč, Deepfake detekce, Lidské vnímání, Kvalita řeči, Kybernetická bezpečnost

Abstrakt

V tomto článku se zabýváme novým dvoustranným výzkumem rozpoznávání hluboké falešné řeči lidmi a řešíme kritické mezery v dosavadním výzkumu. Za prvé, jsme průkopníky hodnocení vlivu předchozí informace na rozpoznávání deepfake, přičemž se naše práce odlišuje tím, že simuluje reálné scénáře útoku, kdy jednotlivci nejsou předem informováni o odhalení deepfake. Tento přístup simuluje nepředvídatelnost reálných deepfake útoků a poskytuje bezprecedentní vhled do lidské zranitelnosti za realistických podmínek. Za druhé, zavádíme novou metriku pro hodnocení kvality deepfake zvuku. Tato metrika usnadňuje hlubší zkoumání toho, jak kvalita deepfake řeči ovlivňuje přesnost detekce člověka. Tím, že zkoumáme jak vliv předchozích znalostí o deepfakes, tak roli kvality deepfake řeči, náš výzkum odhaluje důležitost těchto faktorů, přispívá k pochopení lidské zranitelnosti vůči deepfakes a navrhuje opatření ke zlepšení lidských detekčních schopností.

Rok
2024
Strany
1-25
Časopis
Eurasip Journal on Image and Video Processing, roč. 2024, č. 1, ISSN 1687-5281
Vydavatel
Springer International Publishing
DOI
EID Scopus
BibTeX
@ARTICLE{FITPUB13163,
   author = "Kamil Malinka and Anton Firc and Milan \v{S}alko and Daniel Prudk\'{y} and Karol\'{i}na Rada\v{c}ovsk\'{a} and Petr Han\'{a}\v{c}ek",
   title = "Comprehensive Multiparametric Analysis of Human Deepfake Speech Recognition",
   pages = "1--25",
   journal = "Eurasip Journal on Image and Video Processing",
   volume = 2024,
   number = 1,
   year = 2024,
   ISSN = "1687-5281",
   doi = "10.1186/s13640-024-00641-4",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13163"
}
Nahoru