Detail publikace

The IWSLT 2021 BUT Speech Translation Systems

VYDANA, H.; KARAFIÁT, M.; BURGET, L.; ČERNOCKÝ, J. The IWSLT 2021 BUT Speech Translation Systems. In Proceedings of 18th International Conference on Spoken Language Translation (IWSLT). Bangkok, on-line: Association for Computational Linguistics, 2021. p. 75-83. ISBN: 978-1-7138-3378-9.
Název česky
BUT systém pro strojový překlad z řeči pro IWSLT 2021
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

speech, translation

Abstrakt

Příspěvek popisuje offline systémy překladu řeči z angličtiny do němčiny vyvinuté na VUT v Brně pro IWSLT2021. Jsou založeny naspolečně trénovaném automatickém rozpoznávání řeči -na modelech strojového překladu. Jejich výkonje hodnocen na testu MustC-Commonsoubor. V této práci studujeme jejich účinnostz pohledu velkého množstvísamostatných tréninkových dat ASR a trénování MTdat a z pohledu menšího množství překladů řečitrénovaných dat. Velké množství trénovacích dat ASR a MT se využívá pro předtrénovánímodelů ASR a MT. Speechtranslationdata se používají ke společné optimalizaciModelů ASR-MT definováním end-to-enddiferencovatelné cesty od řeči k překladům.K tomuto účelu používáme vnitřní průběžnoureprezentaci z dekodéru ASR avstup do modulu MT. Ukážemem že překlad řeči lze dále zlepšit školenímdekodéru ASR společně s modulem MTpomocí velkého množství pouze textového trénování MTdat. Ukazujeme také výrazná zlepšení trénováním modulu ASR schopného generovatpřerušovaný text, než aby interpunkční úloha byla ponechána na MT modulu.

Rok
2021
Strany
75–83
Sborník
Proceedings of 18th International Conference on Spoken Language Translation (IWSLT)
Konference
18TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE TRANSLATION, Bangkok (on-line), TH
ISBN
978-1-7138-3378-9
Vydavatel
Association for Computational Linguistics
Místo
Bangkok, on-line
DOI
UT WoS
000694723100007
EID Scopus
BibTeX
@inproceedings{BUT177246,
  author="Hari Krishna {Vydana} and Martin {Karafiát} and Lukáš {Burget} and Jan {Černocký}",
  title="The IWSLT 2021 BUT Speech Translation Systems",
  booktitle="Proceedings of 18th International Conference on Spoken Language Translation (IWSLT)",
  year="2021",
  pages="75--83",
  publisher="Association for Computational Linguistics",
  address="Bangkok, on-line",
  doi="10.18653/v1/2021.iwslt-1.7",
  isbn="978-1-7138-3378-9",
  url="https://aclanthology.org/2021.iwslt-1.7.pdf"
}
Nahoru