Detail publikace
Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language
Klement Dominik, Bc. (FIT VUT)
Huang Ruizhe (JHU)
Wiesner Matthew (JHU)
Khudanpur Sanjeev (JHU)
konverzační řeč, diarizace, rozpoznávání řeči
Jak technologie řeči vyspěla, došlo k tlaku na systémy oddělení, které dokážou zpracovat konverzační řeč, odrážet takzvaný "problém koktejlových večírků", který zahrnuje nikoli pouze náročnější akustické podmínky, ale také nutnost uvádí řešení nových problémů, jako je identifikace toho, kdo mluvil při zpracování více souběžných proudů řeči. K těmto problémům se přistupuje především prostřednictvím korpusů zahrnující obchodní jednání a večírky s výhledem široký rozsah konverzační dynamiky a de- mografie, které spadají do kategorie multimluvčích řečí. Za tímto účelem zavádíme použití korpusu Santa Barbara mluvené americké angličtiny pro hodnocení řečových technologií gy - včetně přípravy korpusu a anotací pro auto- matické zpracování, demonstrující selhání nejmodernějšího stavu techniky systémy odolávající heterogenitě podmínek a vysoké osvětlení situací, kde standardní metody mají potíže forma vůbec
@INPROCEEDINGS{FITPUB13325, author = "Matthew Maciejewski and Dominik Klement and Ruizhe Huang and Matthew Wiesner and Sanjeev Khudanpur", title = "Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language", pages = "2155--2160", booktitle = "Proceedings of Interspeech 2024", journal = "Proceedings of Interspeech - on-line", volume = 2024, number = 9, year = 2024, location = "Kos, GR", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2024-2119", language = "english", url = "https://www.fit.vut.cz/research/publication/13325" }