نقل بيانات التدريب الترجمة المختلطة


الملخص بالعربية

الترجمة الآلية للمدخلات المزدوجة التي تم إنشاؤها بواسطة المستخدمين إلى اللغة الإنجليزية ذات أهمية حاسمة في التطبيقات مثل البحث على شبكة الإنترنت والإعلانات المستهدفة.نحن نتطلع إلى ندرة البيانات التدريبية الموازية لتدريب هذه النماذج عن طريق تصميم استراتيجية لتحويل مصادر البيانات المتوازية الموجزة غير المزججة الحالية إلى البيانات الموازية المختلطة.نقدم إجراء يستند إلى M-Bert إلى مكونه الأساسي الذي يمكن أن يكون نموذج وضع العلامات ثلاثية التسلسلات، والتي يمكن تدريبها على Corpus محدود مختلط رمزيا وحدها.نعرض زيادة بنسبة 5.8 نقطة في بلو على الجمل المختلطة شفرة الشفرة من خلال تدريب نموذج الترجمة باستخدام استراتيجية تكبير البيانات الخاصة بنا حول مهمة الترجمة من اللغة الهندية-الإنجليزية المختلطة.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث