Detail publikace

Deriving Spectro-temporal Properties of Hearing from Speech Data

ONDEL YANG, L.; LI, R.; SELL, G.; HEŘMANSKÝ, H. Deriving Spectro-temporal Properties of Hearing from Speech Data. In Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019. p. 411-415. ISBN: 978-1-5386-4658-8.
Název česky
Odvozování spektrálně-časových vlastností slyšení z řečových dat
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
ONDEL YANG, L.
Li Ruizhi
SELL, G.
Heřmanský Hynek, prof. Ing., Dr. Eng. (UPGM)
URL
Klíčová slova

perception, spectro-temporal, auditory, deeplearning

Abstrakt

Lidské slyšení a lidská řeč jsou vnitřně svázány, protože vlastnosti řeči se téměř jistě vyvinuly, aby byly slyšet lidskými ušima. V důsledku tohoto spojení se ukázalo, že určité vlastnosti lidského sluchu jsou napodobovány v systémech založených na údajích, které jsou vyškoleny k porozumění lidské řeči. V tomto článku dále zkoumáme tento jev měřením spektro-časových odezev datových filtrů v front-end konvoluční vrstvě hluboké sítě vyškolené ke klasifikaci fonémů čisté řeči. Analýzy ukazují, že filtry skutečně vykazují spektro-časové reakce podobné těm, které byly měřeny u savců, a také, že filtry vykazují další úroveň frekvenční selektivity, podobnou zpracovatelskému potrubí předpokládanému v artikulačním indexu.

Rok
2019
Strany
411–415
Sborník
Proceedings of ICASSP
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton
DOI
UT WoS
000482554000083
EID Scopus
BibTeX
@inproceedings{BUT160004,
  author="ONDEL YANG, L. and LI, R. and SELL, G. and HEŘMANSKÝ, H.",
  title="Deriving Spectro-temporal Properties of Hearing from Speech Data",
  booktitle="Proceedings of ICASSP",
  year="2019",
  pages="411--415",
  publisher="IEEE Signal Processing Society",
  address="Brighton",
  doi="10.1109/ICASSP.2019.8682787",
  isbn="978-1-5386-4658-8",
  url="https://ieeexplore.ieee.org/document/8682787"
}
Soubory
Nahoru