في صعوبة ترجمة لغات وضع علامات الترتيب الحرة


الملخص بالعربية

التجرخص تحديد العوامل التي تجعل لغات معينة يصعب طرازها من غيرها ضرورية للوصول إلى المساواة اللغوية في تكنولوجيات معالجة اللغة الطبيعية في المستقبل. لقد أثبتت لغات وضع علامات الترتيب الحرة، مثل اللغة الروسية أو اللاتينية أو التاميلية أكثر تحديا أكثر من لغات الطلب الثابت لمهام التنبؤ بالتحليل النحوي وتنبؤ اتفاقية الأم الفعل. في هذا العمل، نحقق ما إذا كانت هذه الفئة من اللغات أكثر صعوبة أيضا ترجمتها من قبل نماذج الترجمة الآلية الحديثة (NMT). باستخدام مجموعة متنوعة من اللغات الاصطناعية ومجموعة تحدي الترجمة المقدمة حديثا، نجد أن مرونة ترتيب الكلمات في اللغة المصدر تؤدي فقط إلى فقدان جودة NMT فقط، على الرغم من أن حجج الفعل الأساسية تصبح مستحيلة في الغموض في الجمل دون إشارات دلالية وبعد تم حل المشكلة الأخيرة بالفعل عن طريق إضافة علامات الحالة. ومع ذلك، في إعدادات الموارد المتوسطة والمنخفضة، لا تزال جودة NMT الإجمالية لغات النظام الثابت لا مثيل لها.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث