التجرخص تحديد العوامل التي تجعل لغات معينة يصعب طرازها من غيرها ضرورية للوصول إلى المساواة اللغوية في تكنولوجيات معالجة اللغة الطبيعية في المستقبل. لقد أثبتت لغات وضع علامات الترتيب الحرة، مثل اللغة الروسية أو اللاتينية أو التاميلية أكثر تحديا أكثر من لغات الطلب الثابت لمهام التنبؤ بالتحليل النحوي وتنبؤ اتفاقية الأم الفعل. في هذا العمل، نحقق ما إذا كانت هذه الفئة من اللغات أكثر صعوبة أيضا ترجمتها من قبل نماذج الترجمة الآلية الحديثة (NMT). باستخدام مجموعة متنوعة من اللغات الاصطناعية ومجموعة تحدي الترجمة المقدمة حديثا، نجد أن مرونة ترتيب الكلمات في اللغة المصدر تؤدي فقط إلى فقدان جودة NMT فقط، على الرغم من أن حجج الفعل الأساسية تصبح مستحيلة في الغموض في الجمل دون إشارات دلالية وبعد تم حل المشكلة الأخيرة بالفعل عن طريق إضافة علامات الحالة. ومع ذلك، في إعدادات الموارد المتوسطة والمنخفضة، لا تزال جودة NMT الإجمالية لغات النظام الثابت لا مثيل لها.
Abstract Identifying factors that make certain languages harder to model than others is essential to reach language equality in future Natural Language Processing technologies. Free-order case-marking languages, such as Russian, Latin, or Tamil, have proved more challenging than fixed-order languages for the tasks of syntactic parsing and subject-verb agreement prediction. In this work, we investigate whether this class of languages is also more difficult to translate by state-of-the-art Neural Machine Translation (NMT) models. Using a variety of synthetic languages and a newly introduced translation challenge set, we find that word order flexibility in the source language only leads to a very small loss of NMT quality, even though the core verb arguments become impossible to disambiguate in sentences without semantic cues. The latter issue is indeed solved by the addition of case marking. However, in medium- and low-resource settings, the overall NMT quality of fixed-order languages remains unmatched.
المراجع المستخدمة
https://aclanthology.org/
تجزئة الكلمات، مشكلة إيجاد حدود الكلمات في الكلام، تهم مجموعة من المهام.اقترحت الأوراق السابقة أن نماذج تسلسل إلى تسلسل تدربت على مهام مثل ترجمة الكلام أو التعرف على الكلام، ويمكن استخدام الاهتمام لتحديد الكلمات والجزء.ومع ذلك، نوضح ذلك حتى على بيانا
في هذا العمل، نحقق في أساليب المهمة الصعبة المتمثلة في الترجمة بين أزواج لغة الموارد المنخفضة التي تظهر بعض مستوى التشابه.على وجه الخصوص، نعتبر فائدة نقل التعلم للترجمة بين العديد من لغات الموارد المنخفضة الأوروبية من الهند من الأسر الجرمانية والروما
يتناول هذا البحث بالتحليل لآليات التكامل التشغيلي بين المنطقة الحرة المرفئية و الميناء البحري ، استناداً الى دراسة حالة للمنطقة الحرة و ميناء جبل علي ، و التى تم اختيارها اعتباراً للمركز المرموق الذى يحتله ميناء جبل علي و المنطقة الحرة فى الصدارة الع
نماذج الترجمة العصبية متعددة اللغات تعامل مع لغة مصدر واحدة في وقت واحد.ومع ذلك، فقد أظهر العمل السابق أن الترجمة من لغات مصدر متعددة تعمل على تحسين جودة الترجمة.تختلف عن الأساليب الحالية على الترجمة المتعددة المصدر التي تقتصر على سيناريو الاختبار حي
يركز استخراج علاقات قليلة (FSRE) على الاعتراف بعلاقات جديدة من خلال التعلم مع مجرد حفنة من الحالات المشروح.تم اعتماد التعلم التلوي على نطاق واسع لمثل هذه المهمة، والتي تتدرب على إنشاء مهام قليلة من الرصاص بشكل عشوائي لتعلم تمثيلات بيانات عامة.على الر