Detail publikace

Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals

PEŠÁN, J.; JUŘÍK, V.; RŮŽIČKOVÁ, A.; SVOBODA, V.; JANOUŠEK, O.; NĚMCOVÁ, A.; BOJANOVSKÁ, H.; ALDABAGHOVÁ, J.; KYSLÍK, F.; VODIČKOVÁ, K.; SODOMOVÁ, A.; BARTYS, P.; CHUDÝ, P.; ČERNOCKÝ, J. Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals. Scientific data, 2024, vol. 11, no. 1, p. 1-9. ISSN: 2052-4463.
Název česky
Tvorba řeči ve stresu pro strojové učení: multimodální dataset 79 mluvčích a 8 signálů
Typ
článek v časopise
Jazyk
anglicky
Autoři
Pešán Jan, Ing. (UPGM)
Juřík Vojtěch, Mgr., Ph.D. (VUT)
Růžičková Alexandra
Svoboda Vojtěch, Bc.
Janoušek Oto, Ing., Ph.D. (UBMI)
Němcová Andrea, Ing., Ph.D. (UBMI)
Bojanovská Hana, Bc.
Aldabaghová Jasmína, Mgr.
Kyslík Filip
Vodičková Kateřina, Bc.
Sodomová Adéla, Bc.
Bartys Patrik, Mgr.
Chudý Peter, doc. Ing., Ph.D., MBA (FIT)
Černocký Jan, prof. Dr. Ing. (UPGM)
URL
Klíčová slova

speech, stress, machine learning

Abstrakt

Včasná identifikace kognitivního nebo fyzického přetížení je zásadní v oblastech,
kde záleží na lidském rozhodování při předcházení ohrožení bezpečnosti a majetku.
Piloti, řidiči, chirurgové a operátoři jaderných elektráren patří mezi ty, kteří
jsou touto výzvou zasaženi, protože akutní stres může zhoršit jejich poznávání.
V této souvislosti vzrůstá význam paralingvistického automatického zpracování
řeči pro včasnou detekci stresu. Intenzita, intonace a kadence výpovědi jsou
příklady paralingvistických rysů, které určují význam věty a často se ztrácejí
v doslovném přepisu. K vyřešení tohoto problému se vyvíjejí nástroje, které
umožňují efektivní rozpoznání paralingvistických rysů. Datové úzké hrdlo však
stále existuje při trénování paralingvistických řečových znaků a přetrvává
nedostatek kvalitních referenčních dat pro trénování umělých systémů. S ohledem
na to uvádíme původní empirický soubor dat shromážděný pomocí experimentálního
protokolu BESST pro zachycení řečových signálů při indukovaném stresu. S těmito
údaji je naším cílem podporovat rozvoj systémů preemptivní intervence založených
na odhadu stresu z řeči.

Rok
2024
Strany
1–9
Časopis
Scientific data, roč. 11, č. 1, ISSN 2052-4463
DOI
UT WoS
001353330000007
EID Scopus
BibTeX
@article{BUT193434,
  author="Jan {Pešán} and Vojtěch {Juřík} and Alexandra {Růžičková} and Vojtěch {Svoboda} and Oto {Janoušek} and Andrea {Němcová} and Hana {Bojanovská} and Jasmína {Aldabaghová} and Filip {Kyslík} and Kateřina {Vodičková} and Adéla {Sodomová} and Patrik {Bartys} and Peter {Chudý} and Jan {Černocký}",
  title="Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals",
  journal="Scientific data",
  year="2024",
  volume="11",
  number="1",
  pages="1--9",
  doi="10.1038/s41597-024-03991-w",
  issn="2052-4463",
  url="https://www.nature.com/articles/s41597-024-03991-w"
}
Soubory
Nahoru