Detail projektu
Real time network, text, and speaker analytics for combating organized crime
Období řešení: 1. 9. 2019 – 31. 12. 2022
Typ projektu: grant
Agentura: Evropská unie
Program: Horizon 2020

Boj proti kriminalitě, Boj proti obchodování s lidmi, Analýza řeči, Analýza
kriminální sítě, Organizovaný zločin, Boj proti terorismu, Platforma pro analýzu,
Právní a etický rámec
Objevování zločineckých sítí a identifikace jejich členů je jedním z hlavních
aspektů poslání LEAs. ROXANNE přispěje k dosažení tohoto cíle tím, že překoná
silné stránky řečových a jazykových technologií (SLT), vizuální analýzy (VA)
a síťové analýzy (NA). Pokud bude financována, ROXANNE dosáhne významného zvýšení
rychlosti vyšetřovacích procesů a zlepšení identifikace osob prostřednictvím řeči
v rámci kriminálních případů, kdy je analyzováno velké množství legálně
zachycených komunikací (s vícejazyčnými atributy). Technický vývoj bude
soustředěn kolem platformy ROXANNE, která posílí schopnost analyzovat kriminální
síť tím, že poskytne rámec pro získávání důkazů a zpravodajských informací
založených na řečových, jazykových a video technologiích. Záměrem není nahradit
lidi, ale automatizovat časově náročné úkoly a podporovat rozhodování LEA. Jeho
časná verze nabídne předběžné schopnosti SLT, VA a NA ke shromažďování zpětné
vazby koncových uživatelů. Konečná verze poskytne vícejazyčné pravděpodobné
nástroje, které propojí technologie SLT a NA, které budou podporovány při
zpracování přirozeného jazyka (NLP) a relační analýzy v grafu synoptické
kriminální činnosti. ROXANNE dosáhne plného souladu s příslušnými právními
a etickými rámcimi INTERPOL a EU, včetně inovativních přístupů k řízení ochrany
údajů, jako je ochrana soukromí od návrhu. Zvláštní úsilí bude vynaloženo, aby se
zajistilo, že výsledky společnosti ROXANNE dosáhnou rozsáhlé přijetí ze strany
donucovacích orgánů. Snaha bude posílena prostřednictvím řady vzdělávacích
a osvětových kampaní a přímého zapojení LEA z devíti evropských zemí, které
otestují naše řešení na základě skutečných údajů. Navíc partner ROXANNE INTERPOL
a EUROPOL (člen externí poradní rady) poskytnou poradenství a poradenství.
Konsorcium má 24 partnerů s komplementárními dovednostmi, včetně vedoucích
pracovníků v klíčových technologických oblastech, které mají dopad na trestní
vyšetřování.
Karafiát Martin, Ing., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Žižka Josef, Ing. (UPGM)
Žmolíková Kateřina, Ing., Ph.D. (FIT)
2024
- MOTLÍČEK, P.; DIKICI, E.; MADIKERI, S.; RANGAPPA, P.; BACKFRIED, G.; ROHDIN, J.; SCHWARZ, P.; KOVÁČ, M.; MALÝ, K.; BOBOŠ, D.; KLAKOW, D.; SERGIDOU, E. ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations. Proceedings of Odyssey 2024: The Speaker and Language Recognition Workshop. Québec City: International Speech Communication Association, 2024.
p. 17-24. Detail
2023
- NIGMATULINA, I.; MADIKERI, S.; VILLATORO-TELLO, E.; MOTLÍČEK, P.; ZULUAGA-GOMEZ, J.; PANDIA, K.; GANAPATHIRAJU, A. Implementing contextual biasing in GPU decoder for online ASR. In Proceedings of the Annual Conference of International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Dublin: International Speech Communication Association, 2023.
p. 4494-4498. ISSN: 1990-9772. Detail - SKOWRON, M.; BACKFRIED, G.; NAVAS, E.; BERZINŠ, A.; VAN, J.; DE, F.; DEMARCO, A.; POLÁK, P.; KOVÁČ, M.; POLÁK, P.; ROHDIN, J.; ROSNER, M.; SANCHEZ, J.; SARATXAGA, I.; SCHWARZ, P. Deep Dive Speech Technology. In European Language Equality. Cham: Springer Nature Switzerland AG, 2023.
p. 289-312. ISBN: 978-3-031-28819-7. Detail
2022
- ALAM, J.; BURGET, L.; GLEMBEK, O.; MATĚJKA, P.; MOŠNER, L.; PLCHOT, O.; ROHDIN, J.; SILNOVA, A.; STAFYLAKIS, T. Development of ABC systems for the 2021 edition of NIST Speaker Recognition evaluation. Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022). Beijing: International Speech Communication Association, 2022.
p. 346-353. Detail - LANDINI, F.; PROFANT, J.; DIEZ SÁNCHEZ, M.; BURGET, L. Bayesian HMM clustering of x-vector sequences (VBx) in speaker diarization: Theory, implementation and analysis on standard tasks. COMPUTER SPEECH AND LANGUAGE, 2022, vol. 71, no. 101254,
p. 1-16. ISSN: 0885-2308. Detail - SILNOVA, A.; STAFYLAKIS, T.; MOŠNER, L.; PLCHOT, O.; ROHDIN, J.; MATĚJKA, P.; BURGET, L.; GLEMBEK, O.; BRUMMER, J. Analyzing speaker verification embedding extractors and back-ends under language and channel mismatch. Proceedings of The Speaker and Language Recognition Workshop (Odyssey 2022). Beijing: International Speech Communication Association, 2022.
p. 9-16. Detail - SOLEWICZ, Y.; COHEN, N.; ROHDIN, J.; MADIKERI, S.; ČERNOCKÝ, J. Speaker recognition on mono-channel telephony recordings. Proceedings of Odyssey 2022. Beijing: International Speech Communication Association, 2022.
p. 193-199. Detail - STAFYLAKIS, T.; MOŠNER, L.; PLCHOT, O.; ROHDIN, J.; SILNOVA, A.; BURGET, L.; ČERNOCKÝ, J. Training Speaker Embedding Extractors Using Multi-Speaker Audio with Unknown Speaker Boundaries. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Incheon: International Speech Communication Association, 2022.
p. 605-609. ISSN: 1990-9772. Detail
2021
- KARAFIÁT, M.; VESELÝ, K.; ČERNOCKÝ, J.; PROFANT, J.; NYTRA, J.; HLAVÁČEK, M.; PAVLÍČEK, T. Analysis of X-Vectors for Low-Resource Speech Recognition. In ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Toronto, Ontario: IEEE Signal Processing Society, 2021.
p. 6998-7002. ISBN: 978-1-7281-7605-5. Detail - LANDINI, F.; GLEMBEK, O.; MATĚJKA, P.; ROHDIN, J.; BURGET, L.; DIEZ SÁNCHEZ, M.; SILNOVA, A. Analysis of the BUT Diarization System for Voxconverse Challenge. In ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Toronto, Ontario: IEEE Signal Processing Society, 2021.
p. 5819-5823. ISBN: 978-1-7281-7605-5. Detail - LANDINI, F.; LOZANO DÍEZ, A.; BURGET, L.; DIEZ SÁNCHEZ, M.; SILNOVA, A.; ŽMOLÍKOVÁ, K.; GLEMBEK, O.; MATĚJKA, P.; STAFYLAKIS, T.; BRUMMER, J. BUT System Description for The Third DIHARD Speech Diarization Challenge. Proceedings available at Dihard Challenge Github. on-line by LDC and University of Pennsylvania: 2021.
p. 1-5. Detail - STAFYLAKIS, T.; ROHDIN, J.; BURGET, L. Speaker embeddings by modeling channel-wise correlations. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021.
p. 501-505. ISSN: 1990-9772. Detail
2020
- ALAM, J.; BOULIANNE, G.; BURGET, L.; DAHMANE, M.; DIEZ SÁNCHEZ, M.; GLEMBEK, O.; LALONDE, M.; LOZANO DÍEZ, A.; MATĚJKA, P.; MIZERA, P.; MOŠNER, L.; NOISEUX, C.; MONTEIRO, J.; NOVOTNÝ, O.; PLCHOT, O.; ROHDIN, J.; SILNOVA, A.; SLAVÍČEK, J.; STAFYLAKIS, T.; ST-CHARLES, P.; WANG, S.; ZEINALI, H. Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge. Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Tokyo: International Speech Communication Association, 2020.
p. 289-295. ISSN: 2312-2846. Detail - LOZANO DÍEZ, A.; SILNOVA, A.; PULUGUNDLA, B.; ROHDIN, J.; VESELÝ, K.; BURGET, L.; PLCHOT, O.; GLEMBEK, O.; NOVOTNÝ, O.; MATĚJKA, P. BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Shanghai: International Speech Communication Association, 2020.
p. 761-765. ISSN: 1990-9772. Detail - MOŠNER, L.; PLCHOT, O.; ROHDIN, J.; ČERNOCKÝ, J. Utilizing VOiCES dataset for multichannel speaker verification with beamforming. Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Tokyo: International Speech Communication Association, 2020.
p. 187-193. ISSN: 2312-2846. Detail - SILNOVA, A.; BRUMMER, J.; ROHDIN, J.; STAFYLAKIS, T.; BURGET, L. Probabilistic embeddings for speaker diarization. Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Tokyo: International Speech Communication Association, 2020.
p. 24-31. ISSN: 2312-2846. Detail