Detail práce

Subspace Modeling of Prosodic Features for Speaker Verification

Disertační práce Student: Kockmann Marcel Akademický rok: 2011/2012 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název česky
Modelování prozodických příznaků pro ověřování mluvčího v pod-prostorech
Jazyk práce
anglický
Abstrakt

Předložená disertační práce se zabývá ověřováním mluvčího pomocí prozodických příznaků zahrnujících hodnoty základního tónu, energie a délek řečových úseků. Studovali jsme dvě rozdílné techniky pro parametrizaci: první vede k dobře definované sadě menšího počtu příznaků, druhá k vysoko-dimenzionální sadě heterogenních prozodických příznaků. První část práce se věnuje vývoji příznaků reprezentujících prozodické kontury, zde jsme vyvinuli a ověřili několik modelovacích technik, s důrazem na modelování v reprezentativních podprostorech.

Druhá část práce se zaměřuje na nové pod-prostorové modelovací techniky pro heterogenní prozodické parametry s velkou dimenzionalitou. Model je teoreticky odvozen a experimentálně ověřen na oficiálních datech z NIST evaluací ověřování mluvčího (NIST Speaker Recognition Evaluation). Ve srovnání s ostatními současnými prozodickými jsme dosáhli podstatně lepších výsledků. Na konci práce presentujeme také novou techniku pro elegantní kombinaci dvou prozodických systémů. Tato technika může být použita rovněž pro fúzi prozodického systému se standardním přesným cepstrálním systémem, což vede k dalšímu podstatnému zvýšení úspěšnosti verifikace.

 

Klíčová slova
Ústav
Studijní program
Výpočetní technika a informatika, obor Výpočetní technika a informatika
Soubory
Stav
obhájeno
Obhajoba
21. května 2012
Citace
KOCKMANN, Marcel. Subspace Modeling of Prosodic Features for Speaker Verification. Brno, 2011. Disertační práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2012-05-21. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/phd-thesis/228/
BibTeX
@phdthesis{FITPT228,
    author = "Marcel Kockmann",
    type = "Diserta\v{c}n\'{i} pr\'{a}ce",
    title = "Subspace Modeling of Prosodic Features for Speaker Verification",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2012,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/phd-thesis/228/"
}
Nahoru