تقدم هذه الورقة تقديم مركز خدمة الترجمة Huawei (HW-TSC) إلى المهمة المشتركة MT Triangular 2021.نشارك في المهمة الروسية إلى الصينية بموجب الحالة المقيدة.نحن نستخدم بنية المحولات والحصول على أفضل أداء عبر متغير بأحجام أكبر معلمة.نقوم بإجراء بيانات مفصلة مسبقا وتصفية البيانات المقدمة على نطاق ثنائي اللغة قدمها.تستخدم العديد من الاستراتيجيات لتدريب نماذجنا، مثل الترجمة متعددة اللغات، الترجمة الترجمة متعددة اللغات، الترجمة إلى الأمام، وتنظيم البيانات، ونقطة التفتيش المتوسطة، والوقاحة، والضبط الجميل، وما إلى ذلك. يحصل نظامنا على 32.5 بلو على مجموعة DEAS و 27.7 بلو على مجموعة الاختبار، أعلى الدرجات بين جميع التقديمات.
This paper presents the submission of Huawei Translation Service Center (HW-TSC) to WMT 2021 Triangular MT Shared Task. We participate in the Russian-to-Chinese task under the constrained condition. We use Transformer architecture and obtain the best performance via a variant with larger parameter sizes. We perform detailed data pre-processing and filtering on the provided large-scale bilingual data. Several strategies are used to train our models, such as Multilingual Translation, Back Translation, Forward Translation, Data Denoising, Average Checkpoint, Ensemble, Fine-tuning, etc. Our system obtains 32.5 BLEU on the dev set and 27.7 BLEU on the test set, the highest score among all submissions.
References used
https://aclanthology.org/
This paper presents the submission of Huawei Translation Services Center (HW-TSC) to WMT 2021 Efficiency Shared Task. We explore the sentence-level teacher-student distillation technique and train several small-size models that find a balance between
This paper presents our work in WMT 2021 Quality Estimation (QE) Shared Task. We participated in all of the three sub-tasks, including Sentence-Level Direct Assessment (DA) task, Word and Sentence-Level Post-editing Effort task and Critical Error Det
This paper presents the submission of Huawei Translate Services Center (HW-TSC) to the WMT 2021 News Translation Shared Task. We participate in 7 language pairs, including Zh/En, De/En, Ja/En, Ha/En, Is/En, Hi/Bn, and Xh/Zu in both directions under t
This paper describes the submission of Huawei Translation Service Center (HW-TSC) to WMT21 biomedical translation task in two language pairs: Chinese↔English and German↔English (Our registered team name is HuaweiTSC). Technical details are introduced
This paper describes Lingua Custodia's submission to the WMT21 shared task on machine translation using terminologies. We consider three directions, namely English to French, Russian, and Chinese. We rely on a Transformer-based architecture as a buil