Detail publikace
ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations
Dikici Erinç (HENSOLDT)
Madikeri Srikanth (IDIAP)
Rangappa Pradeep (IDIAP)
Backfried Gerhard (SAIL LABS Technology AG)
Rohdin Johan A., Dr. (UPGM FIT VUT)
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT)
Kováč Marek (Phonexia)
Malý Květoslav, Ing. (Phonexia)
Boboš Dominik (Phonexia)
Klakow Dietrich (UDS)
a další
Projekt ROXANNE, vedený pod Evropskou Unijní program Horizont 2020, jehož cílem je převrat vyšetřování trestných činů integrací řeči, jazyka a video technologie s analýzou kriminální sítě. Navzdory tomu úspěch ve vývoji technologií, projekt čelil hodnocení problémy kvůli nedostatku a zákonným omezením ing reálných datových sad o trestné činnosti. V reakci na to představujeme duce ROXSD, simulovaný datový soubor komunikace v organizaci nizovaný zločin. ROXSD je soubor odposlouchávaných konverzací (sl. prostřednictvím poskytovatelů komunikačních služeb) mezi drogami jednání s podezřelými podle realistického scénáře (vč. podmínky a omezení skutečného vyšetřování). ze strany donucovacích orgánů (LEA). Se zaměřením na multi- modalita a mnohojazyčnost, soubor dat obsahuje 20 hodin telefonické a video konverzace zahrnující 104 mluvčích a je dále zarovnán s anotacemi základní pravdy pro každý modální umožňující přesné vyhodnocení a rozvoj technologií. Navíc jsou rozšířena multimodální data s metadaty a předchozími znalostmi (např. biometrické údaje podezřelých). profily), který je obvykle dostupný v důsledku zákonného zachycená komunikace. Tento článek představuje ROXSD jako a klíčový zdroj pro pokrok technologie v kriminálním výzkumu (konkrétně v oblasti analýzy řeči, textu a sítě). ROXSD nejen usnadňuje vývoj technologií a hodnocení, ale také ukazuje potenciál sim- datové soubory pro rozvoj v oblasti analýzy organizovaného zločinu ics, zdůrazňující důležitost takových datových sad v nepřítomnosti komplexních reálných alternativ.
@INPROCEEDINGS{FITPUB13307, author = "Petr Motl\'{i}\v{c}ek and Erin\c{c} Dikici and Srikanth Madikeri and Pradeep Rangappa and Gerhard Backfried and A. Johan Rohdin and Petr Schwarz and Marek Kov\'{a}\v{c} and Kv\v{e}toslav Mal\'{y} and Dominik Bobo\v{s} and Dietrich Klakow and Konstantina Eleni Sergidou and et al.", title = "ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations", pages = "17--24", booktitle = "Proceedings of Odyssey 2024: The Speaker and Language Recognition Workshop", year = 2024, location = "Qu\'{e}bec City, CA", publisher = "International Speech Communication Association", doi = "10.21437/odyssey.2024-3", language = "english", url = "https://www.fit.vut.cz/research/publication/13307" }