Detail publikace

Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals

PEŠÁN Jan, JUŘÍK Vojtěch, RŮŽIČKOVÁ Alexandra, SVOBODA Vojtěch, JANOUŠEK Oto, NĚMCOVÁ Andrea, BOJANOVSKÁ Hana, ALDABAGHOVÁ Jasmína, KYSLÍK Filip, VODIČKOVÁ Kateřina, SODOMOVÁ Adéla, BARTYS Patrik, CHUDÝ Peter a ČERNOCKÝ Jan. Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals. Nature Scientific Data, roč. 11, č. 1, 2024, s. 1-9. ISSN 2052-4463. Dostupné z: https://www.nature.com/articles/s41597-024-03991-w

Název česky

Tvorba řeči ve stresu pro strojové učení: multimodální dataset 79 mluvčích a 8 signálů

Typ

článek v časopise

Jazyk

angličtina

Autoři

Pešán Jan, Ing. (UPGM FIT VUT)
Juřík Vojtěch (UAIU FAST VUT)
Růžičková Alexandra (FF MUNI)
Svoboda Vojtěch (FF MUNI)
Janoušek Oto, Ing., Ph.D. (FEKT VUT)
Němcová Andrea, Ing. (UIVT FEI VUT)
Bojanovská Hana (FF MUNI)
Aldabaghová Jasmína (FF MUNI)
Kyslík Filip (FF MUNI)
Vodičková Kateřina (FF MUNI)
Sodomová Adéla (FF MUNI)
Bartys Patrik (FF MUNI)
Chudý Peter, doc. Ing., Ph.D. MBA (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)

URL

Abstrakt

Včasná identifikace kognitivního nebo fyzického přetížení je zásadní v oblastech, kde záleží na lidském rozhodování při předcházení ohrožení bezpečnosti a majetku. Piloti, řidiči, chirurgové a operátoři jaderných elektráren patří mezi ty, kteří jsou touto výzvou zasaženi, protože akutní stres může zhoršit jejich poznávání. V této souvislosti vzrůstá význam paralingvistického automatického zpracování řeči pro včasnou detekci stresu. Intenzita, intonace a kadence výpovědi jsou příklady paralingvistických rysů, které určují význam věty a často se ztrácejí v doslovném přepisu. K vyřešení tohoto problému se vyvíjejí nástroje, které umožňují efektivní rozpoznání paralingvistických rysů. Datové úzké hrdlo však stále existuje při trénování paralingvistických řečových znaků a přetrvává nedostatek kvalitních referenčních dat pro trénování umělých systémů. S ohledem na to uvádíme původní empirický soubor dat shromážděný pomocí experimentálního protokolu BESST pro zachycení řečových signálů při indukovaném stresu. S těmito údaji je naším cílem podporovat rozvoj systémů preemptivní intervence založených na odhadu stresu z řeči.

Rok

2024

Strany

1-9

Časopis

Nature Scientific Data, roč. 11, č. 1, ISSN 2052-4463

Vydavatel

Nature Portfolio Berlin

DOI

10.1038/s41597-024-03991-w

UT WoS

001353330000007

EID Scopus

2-s2.0-85209350842

BibTeX

@ARTICLE{FITPUB13308,
   author = "Jan Pe\v{s}\'{a}n and Vojt\v{e}ch Ju\v{r}\'{i}k and Alexandra R\r{u}\v{z}i\v{c}kov\'{a} and Vojt\v{e}ch Svoboda and Oto Janou\v{s}ek and Andrea N\v{e}mcov\'{a} and Hana Bojanovsk\'{a} and Jasm\'{i}na Aldabaghov\'{a} and Filip Kysl\'{i}k and Kate\v{r}ina Vodi\v{c}kov\'{a} and Ad\'{e}la Sodomov\'{a} and Patrik Bartys and Peter Chud\'{y} and Jan \v{C}ernock\'{y}",
   title = "Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals",
   pages = "1--9",
   journal = "Nature Scientific Data",
   volume = 11,
   number = 1,
   year = 2024,
   ISSN = "2052-4463",
   doi = "10.1038/s41597-024-03991-w",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13308"
}