Detail publikace
Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals
Juřík Vojtěch (UAIU FAST VUT)
Růžičková Alexandra (FF MUNI)
Svoboda Vojtěch (FF MUNI)
Janoušek Oto, Ing., Ph.D. (FEKT VUT)
Němcová Andrea, Ing. (UIVT FEI VUT)
Bojanovská Hana (FF MUNI)
Aldabaghová Jasmína (FF MUNI)
Kyslík Filip (FF MUNI)
Vodičková Kateřina (FF MUNI)
Sodomová Adéla (FF MUNI)
Bartys Patrik (FF MUNI)
Chudý Peter, doc. Ing., Ph.D. MBA (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Včasná identifikace kognitivního nebo fyzického přetížení je zásadní v oblastech, kde záleží na lidském rozhodování při předcházení ohrožení bezpečnosti a majetku. Piloti, řidiči, chirurgové a operátoři jaderných elektráren patří mezi ty, kteří jsou touto výzvou zasaženi, protože akutní stres může zhoršit jejich poznávání. V této souvislosti vzrůstá význam paralingvistického automatického zpracování řeči pro včasnou detekci stresu. Intenzita, intonace a kadence výpovědi jsou příklady paralingvistických rysů, které určují význam věty a často se ztrácejí v doslovném přepisu. K vyřešení tohoto problému se vyvíjejí nástroje, které umožňují efektivní rozpoznání paralingvistických rysů. Datové úzké hrdlo však stále existuje při trénování paralingvistických řečových znaků a přetrvává nedostatek kvalitních referenčních dat pro trénování umělých systémů. S ohledem na to uvádíme původní empirický soubor dat shromážděný pomocí experimentálního protokolu BESST pro zachycení řečových signálů při indukovaném stresu. S těmito údaji je naším cílem podporovat rozvoj systémů preemptivní intervence založených na odhadu stresu z řeči.
@ARTICLE{FITPUB13308, author = "Jan Pe\v{s}\'{a}n and Vojt\v{e}ch Ju\v{r}\'{i}k and Alexandra R\r{u}\v{z}i\v{c}kov\'{a} and Vojt\v{e}ch Svoboda and Oto Janou\v{s}ek and Andrea N\v{e}mcov\'{a} and Hana Bojanovsk\'{a} and Jasm\'{i}na Aldabaghov\'{a} and Filip Kysl\'{i}k and Kate\v{r}ina Vodi\v{c}kov\'{a} and Ad\'{e}la Sodomov\'{a} and Patrik Bartys and Peter Chud\'{y} and Jan \v{C}ernock\'{y}", title = "Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals", pages = "1--9", journal = "Nature Scientific Data", volume = 11, number = 1, year = 2024, ISSN = "2052-4463", doi = "10.1038/s41597-024-03991-w", language = "english", url = "https://www.fit.vut.cz/research/publication/13308" }