Detail publikace

Deriving Spectro-temporal Properties of Hearing from Speech Data

ONDEL Yang Lucas Antoine Francois, LI Ruizhi, SELL Gregory a HEŘMANSKÝ Hynek. Deriving Spectro-temporal Properties of Hearing from Speech Data. In: Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019, s. 411-415. ISBN 978-1-5386-4658-8. Dostupné z: https://ieeexplore.ieee.org/document/8682787
Název česky
Odvozování spektrálně-časových vlastností slyšení z řečových dat
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Li Ruizhi (JHU)
Sell Gregory (JHU)
Heřmanský Hynek, prof. Ing., Dr.Eng. (JHU)
URL
Abstrakt

Lidské slyšení a lidská řeč jsou vnitřně svázány, protože vlastnosti řeči se téměř jistě vyvinuly, aby byly slyšet lidskými ušima. V důsledku tohoto spojení se ukázalo, že určité vlastnosti lidského sluchu jsou napodobovány v systémech založených na údajích, které jsou vyškoleny k porozumění lidské řeči. V tomto článku dále zkoumáme tento jev měřením spektro-časových odezev datových filtrů v front-end konvoluční vrstvě hluboké sítě vyškolené ke klasifikaci fonémů čisté řeči. Analýzy ukazují, že filtry skutečně vykazují spektro-časové reakce podobné těm, které byly měřeny u savců, a také, že filtry vykazují další úroveň frekvenční selektivity, podobnou zpracovatelskému potrubí předpokládanému v artikulačním indexu.

Rok
2019
Strany
411-415
Sborník
Proceedings of ICASSP
Konference
2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), Brighton, GB
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton, GB
DOI
UT WoS
000482554000083
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12097,
   author = "Francois Antoine Lucas Yang Ondel and Ruizhi Li and Gregory Sell and Hynek He\v{r}mansk\'{y}",
   title = "Deriving Spectro-temporal Properties of Hearing from Speech Data",
   pages = "411--415",
   booktitle = "Proceedings of ICASSP",
   year = 2019,
   location = "Brighton, GB",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-5386-4658-8",
   doi = "10.1109/ICASSP.2019.8682787",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12097"
}
Nahoru