ترجمة آلة متعددة الوسائط (MMT) تثري النص المصدر بمعلومات مرئية للترجمة.لقد اكتسبت شعبية في السنوات الأخيرة، وقد اقترح العديد من خطوط الأنابيب في نفس الاتجاه.ومع ذلك، تفتقر المهمة إلى مجموعات بيانات الجودة لتوضيح مساهمة الوسيلة البصرية في أنظمة الترجمة.في هذه الورقة، نقترح نظامنا تحت اسم الفريق فولتا لمهمة الترجمة متعددة الوسائط في WAT 2021 من الإنجليزية إلى الهندية.نشارك أيضا في التراكب الفرعي النصي فقط لنفس زوج اللغة التي نستخدمها MBART، وهي نموذج تسلسل متعدد اللغات مسبقا.بالنسبة للترجمة متعددة الوسائط، نقترح تعزيز المدخلات النصية من خلال إحضار المعلومات المرئية إلى مجال نصي عن طريق استخراج علامات الكائنات من الصورة.نستكشف أيضا متانة نظامنا عن طريق مهينة النص المصدر بشكل منهجي.أخيرا، نحقق درجة بلو من 44.6 و 51.6 في مجموعة الاختبار ومجموعة التحدي بمهمة متعددة الوسائط.
Multimodal Machine Translation (MMT) enriches the source text with visual information for translation. It has gained popularity in recent years, and several pipelines have been proposed in the same direction. Yet, the task lacks quality datasets to illustrate the contribution of visual modality in the translation systems. In this paper, we propose our system under the team name Volta for the Multimodal Translation Task of WAT 2021 from English to Hindi. We also participate in the textual-only subtask of the same language pair for which we use mBART, a pretrained multilingual sequence-to-sequence model. For multimodal translation, we propose to enhance the textual input by bringing the visual information to a textual domain by extracting object tags from the image. We also explore the robustness of our system by systematically degrading the source text. Finally, we achieve a BLEU score of 44.6 and 51.6 on the test set and challenge set of the multimodal task.
المراجع المستخدمة
https://aclanthology.org/
تمكن الترجمة الآلية العصبية متعددة اللغات (NMT) نموذج واحد لخدمة جميع اتجاهات الترجمة، بما في ذلك تلك التي هي غير مرئية أثناء التدريب، I.E. Zero-Shot الترجمة. على الرغم من أن النماذج الحالية جذابة من الناحية النظرية غالبا ما تنتج ترجمات منخفضة الجودة
في هذه الورقة، نظهر أن الأسئلة والأجوبة التي تم إنشاؤها تلقائيا يمكن استخدامها لتقييم جودة أنظمة الترجمة الآلية (MT).بناء على العمل الحديث على تقييم تلخيص نص مبيعات، نقترح مقياس جديد لتقييم MT على مستوى النظام، ومقارنته بالحلول الأخرى الأخرى، وإظهار متانة لها من خلال إجراء تجارب لمختلف اتجاهات MT.
يترجم الأساليب الموجودة للترجمة الآلية (MT) في الغالب نص معين في لغة المصدر في اللغة المستهدفة وبدون تشير صراحة إلى المعلومات التي لا غنى عنها لإنتاج ترجمة مناسبة. لا يشمل ذلك فقط المعلومات في العناصر والطرائق النصية الأخرى من النصوص الموجودة في نفس
نصوص وصفة هي شكل خصوصي للغة التعليمية التي تشكل تحديات فريدة من نوعها للتفاهم التلقائي.أحد التحديات هو أن خطوة الطهي في وصفة واحدة يمكن تفسيرها في وصفة أخرى بكلمات مختلفة، على مستوى مختلف من التجريد، أم لا على الإطلاق.تعلق العمل السابق المراسلات بين
مجلة نجد أن متطلبات الترجمة النموذجية لتكون مخلصا غامضة وغير مكتملة. مع التفسير من خلال أبرز النصوص النصية كدراسة حالة، نقدم العديد من حالات الفشل. استعارة مفاهيم الاقتراض من العلوم الاجتماعية، نحدد أن المشكلة هي اختلال بين السلسلة السببية للقرارات (