تصف هذه الورقة عملنا في الترجمة الآلية لعام 2021 باستخدام المهمة المشتركة للمصطلحات.نشارك في مهمة مصطلحات الترجمة المشتركة في اللغة الإنجليزية إلى زوج اللغة الصينية.لإرضاء قيود المصطلحات على الترجمة، نستخدم استراتيجية تكبير بيانات المصطلحات بناء على نموذج المحول.استخدمنا علامات لوضع علامة وإضافة ترجمة المصطلح إلى الجمل المتطابقة.أنشأنا مصطلحات صناعية باستخدام عبارات تم استخراجها من Corpus ثنائية اللغة لزيادة نسبة ترجمات المصطلح في بيانات التدريب.يتم استخدام المعالجة المفصلة المسبقة والتصفية على البيانات، يتم استخدام أسلوب Finetuning في المجال والكفر في نظامنا.تقدمنا يحصل على نتائج تنافسية في التقييم المستهدف للمصطلحات.
This paper describes our work in the WMT 2021 Machine Translation using Terminologies Shared Task. We participate in the shared translation terminologies task in English to Chinese language pair. To satisfy terminology constraints on translation, we use a terminology data augmentation strategy based on Transformer model. We used tags to mark and add the term translations into the matched sentences. We created synthetic terms using phrase tables extracted from bilingual corpus to increase the proportion of term translations in training data. Detailed pre-processing and filtering on data, in-domain finetuning and ensemble method are used in our system. Our submission obtains competitive results in the terminology-targeted evaluation.
References used
https://aclanthology.org/
This paper describes Kakao Enterprise's submission to the WMT21 shared Machine Translation using Terminologies task. We integrate terminology constraints by pre-training with target lemma annotations and fine-tuning with exact target annotations util
This paper describes NiuTrans neural machine translation systems of the WMT 2021 news translation tasks. We made submissions to 9 language directions, including English2Chinese, Japanese, Russian, Icelandic and English2Hausa tasks. Our primary system
Language domains that require very careful use of terminology are abundant and reflect a significant part of the translation industry. In this work we introduce a benchmark for evaluating the quality and consistency of terminology translation, focusi
This paper describes the Global Tone Communication Co., Ltd.'s submission of the WMT21 shared news translation task. We participate in six directions: English to/from Hausa, Hindi to/from Bengali and Zulu to/from Xhosa. Our submitted systems are unco
This paper describes Mininglamp neural machine translation systems of the WMT2021 news translation tasks. We have participated in eight directions translation tasks for news text including Chinese to/from English, Hausa to/from English, German to/fro