يتم استخدام نماذج ما بعد التحرير التلقائي (APE) مخرجات نظام الترجمة الآلية (MT) الصحيحة عن طريق التعلم من أنماط ما بعد التحرير البشري.نقدم النظام المستخدم في التقديم الخاص بنا إلى المهمة المشتركة (APE) APانية (EN-DE).نستفيد نظام MT الحديث (NG et al.، 2019) لهذه المهمة.للحصول على مزيد من التحسينات، نقوم بتكييف نموذج MT إلى مجال المهام باستخدام Wikimatrix (Schwenket al.، 2021) متبوعا بضبط جيد مع عينات إضافية للقرد من الإصدارات السابقة للمهمة المشتركة (WMT-16،17،18) وتمتلكنماذج.تغلب أنظمتنا على خط الأساس على درجات TER على مجموعة اختبار WMT'21.
Automatic post-editing (APE) models are usedto correct machine translation (MT) system outputs by learning from human post-editing patterns. We present the system used in our submission to the WMT'21 Automatic Post-Editing (APE) English-German (En-De) shared task. We leverage the state-of-the-art MT system (Ng et al., 2019) for this task. For further improvements, we adapt the MT model to the task domain by using WikiMatrix (Schwenket al., 2021) followed by fine-tuning with additional APE samples from previous editions of the shared task (WMT-16,17,18) and ensembling the models. Our systems beat the baseline on TER scores on the WMT'21 test set.
المراجع المستخدمة
https://aclanthology.org/
قام تطوير تقنيات الترجمة، مثل ذاكرة الترجمة والترجمة الآلية، قد غيرت تماما سير عمل صناعة الترجمة وسير العمل في العقود الماضية.ومع ذلك، تم تطوير TM و MT بشكل منفصل حتى وقت قريب.سيقوم هذا المشروع المستمر بدراسة التكامل الخارجي ل TM و MT، وفحص ما إذا كا
تقدم هذه الورقة بيانات عن تصورات تدريب المتدربين في عملية MTPE وآثار التدريب على التدريب في هذا المجال.تهدف هذه الدراسة إلى تحليل أداء المتدربين في ثلاثة مهام MTPE الزوجية باللغة الإنجليزية البولندية ومقابلات ما بعد المهام لتحديد الحاجة إلى تعزيز مها
تتطلب الترجمة الدقيقة معلومات على مستوى المستندات، والتي يتم تجاهلها بواسطة الترجمة الآلية على مستوى الجملة.لقد أظهر العمل الحديث أن الاتساق على مستوى المستند يمكن تحسينه باستخدام معلومات ما بعد التحرير التلقائي باستخدام معلومات اللغة المستهدفة فقط (
اكتسبت نهج الترجمة الآلية العصبية شعبية في الترجمة الآلية بسبب تحليل سياقها وقدرتها ومعالجتها لقضايا الاعتماد على المدى الطويل.لقد شاركنا في المهمة المشتركة WMT21 الخاصة بترجمة اللغة المماثلة على زوج التاميل التيلجو مع اسم الفريق: NILP-NITS.في هذه ال
تعمل العديد من نماذج NLP على تسلسل الرموز الرموز الفرعية التي تنتجها قواعد التزخم المصنوعة يدويا وخوارزميات التعريفي للكلمة الفرعية.بديل عالمي بسيط هو تمثيل كل نص محوسب كسلسلة من البايتات عبر UTF-8، وضبط الحاجة إلى طبقة تضمين نظرا لأن هناك عدد أقل من