Detail publikace

Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals

PEŠÁN Jan, JUŘÍK Vojtěch, RŮŽIČKOVÁ Alexandra, SVOBODA Vojtěch, JANOUŠEK Oto, NĚMCOVÁ Andrea, BOJANOVSKÁ Hana, ALDABAGHOVÁ Jasmína, KYSLÍK Filip, VODIČKOVÁ Kateřina, SODOMOVÁ Adéla, BARTYS Patrik, CHUDÝ Peter a ČERNOCKÝ Jan. Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals. Nature Scientific Data, roč. 11, č. 1, 2024, s. 1-9. ISSN 2052-4463. Dostupné z: https://www.nature.com/articles/s41597-024-03991-w
Název česky
Tvorba řeči ve stresu pro strojové učení: multimodální dataset 79 mluvčích a 8 signálů
Typ
článek v časopise
Jazyk
angličtina
Autoři
Pešán Jan, Ing. (UPGM FIT VUT)
Juřík Vojtěch (UAIU FAST VUT)
Růžičková Alexandra (FF MUNI)
Svoboda Vojtěch (FF MUNI)
Janoušek Oto, Ing., Ph.D. (FEKT VUT)
Němcová Andrea, Ing. (UIVT FEI VUT)
Bojanovská Hana (FF MUNI)
Aldabaghová Jasmína (FF MUNI)
Kyslík Filip (FF MUNI)
Vodičková Kateřina (FF MUNI)
Sodomová Adéla (FF MUNI)
Bartys Patrik (FF MUNI)
Chudý Peter, doc. Ing., Ph.D. MBA (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
URL
Abstrakt

Včasná identifikace kognitivního nebo fyzického přetížení je zásadní v oblastech, kde záleží na lidském rozhodování při předcházení ohrožení bezpečnosti a majetku. Piloti, řidiči, chirurgové a operátoři jaderných elektráren patří mezi ty, kteří jsou touto výzvou zasaženi, protože akutní stres může zhoršit jejich poznávání. V této souvislosti vzrůstá význam paralingvistického automatického zpracování řeči pro včasnou detekci stresu. Intenzita, intonace a kadence výpovědi jsou příklady paralingvistických rysů, které určují význam věty a často se ztrácejí v doslovném přepisu. K vyřešení tohoto problému se vyvíjejí nástroje, které umožňují efektivní rozpoznání paralingvistických rysů. Datové úzké hrdlo však stále existuje při trénování paralingvistických řečových znaků a přetrvává nedostatek kvalitních referenčních dat pro trénování umělých systémů. S ohledem na to uvádíme původní empirický soubor dat shromážděný pomocí experimentálního protokolu BESST pro zachycení řečových signálů při indukovaném stresu. S těmito údaji je naším cílem podporovat rozvoj systémů preemptivní intervence založených na odhadu stresu z řeči.

Rok
2024
Strany
1-9
Časopis
Nature Scientific Data, roč. 11, č. 1, ISSN 2052-4463
Vydavatel
Nature Portfolio Berlin
DOI
UT WoS
001353330000007
EID Scopus
BibTeX
@ARTICLE{FITPUB13308,
   author = "Jan Pe\v{s}\'{a}n and Vojt\v{e}ch Ju\v{r}\'{i}k and Alexandra R\r{u}\v{z}i\v{c}kov\'{a} and Vojt\v{e}ch Svoboda and Oto Janou\v{s}ek and Andrea N\v{e}mcov\'{a} and Hana Bojanovsk\'{a} and Jasm\'{i}na Aldabaghov\'{a} and Filip Kysl\'{i}k and Kate\v{r}ina Vodi\v{c}kov\'{a} and Ad\'{e}la Sodomov\'{a} and Patrik Bartys and Peter Chud\'{y} and Jan \v{C}ernock\'{y}",
   title = "Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals",
   pages = "1--9",
   journal = "Nature Scientific Data",
   volume = 11,
   number = 1,
   year = 2024,
   ISSN = "2052-4463",
   doi = "10.1038/s41597-024-03991-w",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13308"
}
Nahoru