Detail publikace
The IWSLT 2021 BUT Speech Translation Systems
Karafiát Martin, Ing., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
speech, translation
Příspěvek popisuje offline systémy překladu řeči z angličtiny do němčiny vyvinuté na VUT v Brně pro IWSLT2021. Jsou založeny naspolečně trénovaném automatickém rozpoznávání řeči -na modelech strojového překladu. Jejich výkonje hodnocen na testu MustC-Commonsoubor. V této práci studujeme jejich účinnostz pohledu velkého množstvísamostatných tréninkových dat ASR a trénování MTdat a z pohledu menšího množství překladů řečitrénovaných dat. Velké množství trénovacích dat ASR a MT se využívá pro předtrénovánímodelů ASR a MT. Speechtranslationdata se používají ke společné optimalizaciModelů ASR-MT definováním end-to-enddiferencovatelné cesty od řeči k překladům.K tomuto účelu používáme vnitřní průběžnoureprezentaci z dekodéru ASR avstup do modulu MT. Ukážemem že překlad řeči lze dále zlepšit školenímdekodéru ASR společně s modulem MTpomocí velkého množství pouze textového trénování MTdat. Ukazujeme také výrazná zlepšení trénováním modulu ASR schopného generovatpřerušovaný text, než aby interpunkční úloha byla ponechána na MT modulu.
@inproceedings{BUT177246,
author="Hari Krishna {Vydana} and Martin {Karafiát} and Lukáš {Burget} and Jan {Černocký}",
title="The IWSLT 2021 BUT Speech Translation Systems",
booktitle="Proceedings of 18th International Conference on Spoken Language Translation (IWSLT)",
year="2021",
pages="75--83",
publisher="Association for Computational Linguistics",
address="Bangkok, on-line",
doi="10.18653/v1/2021.iwslt-1.7",
isbn="978-1-7138-3378-9",
url="https://aclanthology.org/2021.iwslt-1.7.pdf"
}