Detail projektu
Kvalitativní posun v automatickém rozpoznávání jazyků s využitím streamovaných audio-médií
Období řešení: 19. 1. 2006 – 19. 7. 2007
Typ projektu: grant
Kód: 162/2005
zpracování řeči, identifikace jazyka, paralelní výpočty, získávání řečových dat,
streaming
Projekt je zaměřen na masivní využití streamovaného audia pro kvalitativní posun
v úspěšnosti systémů pro automatickou identifikaci jazyka (language
identification - LID). Skupina zpracování řeči na Fakultě informačních
technologií VUT v Brně (Speech@FIT), jejíž členové projekt podávají, disponuje
state-of-the-art systémem pro LID jazyka založeným na akustickém a fonotaktickém
modelování. Pro jeho další zlepšení je nutné získat velká množství jazykově
závislých dat. V rámci projektu budou tato data získávána z dostupných
streamovaných zdrojů (internetová rádia), on-line ukládána, parametrizována
a zpracovávána. Bude vyvíjen software pro paralelní trénování modelů pro LID.
Získané modely a algoritmy budou evaluovány v rámci mezinárodních kampaní NIST
a ve spolupráci s českými bezpečnostními složkami.
Kašpárek Tomáš, Ing., Ph.D. (CVT)
Matějka Pavel, Ing., Ph.D.
Schwarz Petr, Ing., Ph.D. (UPGM)