Detail publikace

Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language

MACIEJEWSKI Matthew, KLEMENT Dominik, HUANG Ruizhe, WIESNER Matthew a KHUDANPUR Sanjeev. Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language. In: Proceedings of Interspeech 2024. Kos: International Speech Communication Association, 2024, s. 2155-2160. ISSN 1990-9772. Dostupné z: https://www.isca-archive.org/interspeech_2024/maciejewski24_interspeech.pdf

Název česky

Hodnocení řečových technologií na Santa Barbara korpusu: výzvy konverzační mluvené řeči

Typ

článek ve sborníku konference

Jazyk

angličtina

Autoři

Maciejewski Matthew (JHU)
Klement Dominik, Bc. (FIT VUT)
Huang Ruizhe (JHU)
Wiesner Matthew (JHU)
Khudanpur Sanjeev (JHU)

URL

Klíčová slova

konverzační řeč, diarizace, rozpoznávání řeči

Abstrakt

Jak technologie řeči vyspěla, došlo k tlaku na systémy oddělení, které dokážou zpracovat konverzační řeč, odrážet takzvaný "problém koktejlových večírků", který zahrnuje nikoli pouze náročnější akustické podmínky, ale také nutnost uvádí řešení nových problémů, jako je identifikace toho, kdo mluvil při zpracování více souběžných proudů řeči. K těmto problémům se přistupuje především prostřednictvím korpusů zahrnující obchodní jednání a večírky s výhledem široký rozsah konverzační dynamiky a de- mografie, které spadají do kategorie multimluvčích řečí. Za tímto účelem zavádíme použití korpusu Santa Barbara mluvené americké angličtiny pro hodnocení řečových technologií gy - včetně přípravy korpusu a anotací pro auto- matické zpracování, demonstrující selhání nejmodernějšího stavu techniky systémy odolávající heterogenitě podmínek a vysoké osvětlení situací, kde standardní metody mají potíže forma vůbec

Rok

2024

Strany

2155-2160

Časopis

Proceedings of Interspeech - on-line, roč. 2024, č. 9, ISSN 1990-9772

Sborník

Proceedings of Interspeech 2024

Konference

Interspeech Conference, Kos, GR

Vydavatel

International Speech Communication Association

Místo

Kos, GR

DOI

10.21437/Interspeech.2024-2119

BibTeX

@INPROCEEDINGS{FITPUB13325,
   author = "Matthew Maciejewski and Dominik Klement and Ruizhe Huang and Matthew Wiesner and Sanjeev Khudanpur",
   title = "Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language",
   pages = "2155--2160",
   booktitle = "Proceedings of Interspeech 2024",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2024,
   number = 9,
   year = 2024,
   location = "Kos, GR",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2024-2119",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13325"
}