Detail publikace
Deepfake Speech Detection: A Spectrogram Analysis
Malinka Kamil, Mgr., Ph.D. (UITS FIT VUT)
Hanáček Petr, doc. Dr. Ing. (UITS FIT VUT)
Deepfake, Řeč, Obrazová, Detekce Deepfake, Spektrogram
Současné hlasové biometrické systémy nemají žádnou přirozenou mechaniku, která by je chránila před útoky typu deepfake spoofing. Proto je nutné tyto systémy podpořit řešením pro detekci deepfake. Jedním z nejnovějších přístupů k hloubkové detekci falešné řeči je reprezentace řeči jako spektrogramu a jeho použití jako vstupu pro hlubokou neuronovou síť. Tato práce proto analyzuje proveditelnost různých spektrogramů pro hloubkovou detekci falešné řeči. Porovnáváme jejich typy z hlediska jejich výkonu, hardwarových nároků a rychlosti. Ukazujeme, že většina spektrogramů je pro hloubkovou detekci falešné řeči použitelná. Neexistuje však obecná, správná odpověď na výběr nejlepšího spektrogramu. Jak ukazujeme, různé spektrogramy jsou vhodné pro různé potřeby.
@INPROCEEDINGS{FITPUB12908, author = "Anton Firc and Kamil Malinka and Petr Han\'{a}\v{c}ek", title = "Deepfake Speech Detection: A Spectrogram Analysis", pages = "1312--1320", booktitle = "Proceedings of the ACM Symposium on Applied Computing", year = 2024, location = "Avila, ES", publisher = "Association for Computing Machinery", ISBN = "979-8-4007-0243-3", doi = "10.1145/3605098.3635911", language = "english", url = "https://www.fit.vut.cz/research/publication/12908" }