Detail publikace

Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language

MACIEJEWSKI Matthew, KLEMENT Dominik, HUANG Ruizhe, WIESNER Matthew a KHUDANPUR Sanjeev. Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language. In: Proceedings of Interspeech 2024. Kos: International Speech Communication Association, 2024, s. 2155-2160. ISSN 1990-9772. Dostupné z: https://www.isca-archive.org/interspeech_2024/maciejewski24_interspeech.pdf
Název česky
Hodnocení řečových technologií na Santa Barbara korpusu: výzvy konverzační mluvené řeči
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Maciejewski Matthew (JHU)
Klement Dominik, Bc. (FIT VUT)
Huang Ruizhe (JHU)
Wiesner Matthew (JHU)
Khudanpur Sanjeev (JHU)
URL
Klíčová slova

konverzační řeč, diarizace, rozpoznávání řeči

Abstrakt

Jak technologie řeči vyspěla, došlo k tlaku na systémy oddělení, které dokážou zpracovat konverzační řeč, odrážet takzvaný "problém koktejlových večírků", který zahrnuje nikoli pouze náročnější akustické podmínky, ale také nutnost uvádí řešení nových problémů, jako je identifikace toho, kdo mluvil při zpracování více souběžných proudů řeči. K těmto problémům se přistupuje především prostřednictvím korpusů zahrnující obchodní jednání a večírky s výhledem široký rozsah konverzační dynamiky a de- mografie, které spadají do kategorie multimluvčích řečí. Za tímto účelem zavádíme použití korpusu Santa Barbara mluvené americké angličtiny pro hodnocení řečových technologií gy - včetně přípravy korpusu a anotací pro auto- matické zpracování, demonstrující selhání nejmodernějšího stavu techniky systémy odolávající heterogenitě podmínek a vysoké osvětlení situací, kde standardní metody mají potíže forma vůbec

Rok
2024
Strany
2155-2160
Časopis
Proceedings of Interspeech - on-line, roč. 2024, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2024
Konference
Interspeech Conference, Kos, GR
Vydavatel
International Speech Communication Association
Místo
Kos, GR
DOI
BibTeX
@INPROCEEDINGS{FITPUB13325,
   author = "Matthew Maciejewski and Dominik Klement and Ruizhe Huang and Matthew Wiesner and Sanjeev Khudanpur",
   title = "Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language",
   pages = "2155--2160",
   booktitle = "Proceedings of Interspeech 2024",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2024,
   number = 9,
   year = 2024,
   location = "Kos, GR",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2024-2119",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13325"
}
Nahoru