ترغب بنشر مسار تعليمي؟ اضغط هنا

في صعوبة ترجمة لغات وضع علامات الترتيب الحرة

On the Difficulty of Translating Free-Order Case-Marking Languages

639   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

التجرخص تحديد العوامل التي تجعل لغات معينة يصعب طرازها من غيرها ضرورية للوصول إلى المساواة اللغوية في تكنولوجيات معالجة اللغة الطبيعية في المستقبل. لقد أثبتت لغات وضع علامات الترتيب الحرة، مثل اللغة الروسية أو اللاتينية أو التاميلية أكثر تحديا أكثر من لغات الطلب الثابت لمهام التنبؤ بالتحليل النحوي وتنبؤ اتفاقية الأم الفعل. في هذا العمل، نحقق ما إذا كانت هذه الفئة من اللغات أكثر صعوبة أيضا ترجمتها من قبل نماذج الترجمة الآلية الحديثة (NMT). باستخدام مجموعة متنوعة من اللغات الاصطناعية ومجموعة تحدي الترجمة المقدمة حديثا، نجد أن مرونة ترتيب الكلمات في اللغة المصدر تؤدي فقط إلى فقدان جودة NMT فقط، على الرغم من أن حجج الفعل الأساسية تصبح مستحيلة في الغموض في الجمل دون إشارات دلالية وبعد تم حل المشكلة الأخيرة بالفعل عن طريق إضافة علامات الحالة. ومع ذلك، في إعدادات الموارد المتوسطة والمنخفضة، لا تزال جودة NMT الإجمالية لغات النظام الثابت لا مثيل لها.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تجزئة الكلمات، مشكلة إيجاد حدود الكلمات في الكلام، تهم مجموعة من المهام.اقترحت الأوراق السابقة أن نماذج تسلسل إلى تسلسل تدربت على مهام مثل ترجمة الكلام أو التعرف على الكلام، ويمكن استخدام الاهتمام لتحديد الكلمات والجزء.ومع ذلك، نوضح ذلك حتى على بيانا ت أحادية النظرة هشة.في تجاربنا ذات أنواع المدخلات المختلفة، أحجام البيانات، وخوارزميات تجزئة، فقط النماذج المدربة على التنبؤ بالهواتف من الكلمات تنجح في المهمة.النماذج المدربة للتنبؤ بالكلف من الهواتف أو الكلام (أي، الاتجاه المعاكس الذي يحتاج إلى تعميم البيانات الجديدة)، يؤدي إلى نتائج أسوأ بكثير، مما يشير إلى أن التجزئة القائمة على الانتباه مفيد فقط في سيناريوهات محدودة.
في هذا العمل، نحقق في أساليب المهمة الصعبة المتمثلة في الترجمة بين أزواج لغة الموارد المنخفضة التي تظهر بعض مستوى التشابه.على وجه الخصوص، نعتبر فائدة نقل التعلم للترجمة بين العديد من لغات الموارد المنخفضة الأوروبية من الهند من الأسر الجرمانية والروما نسية.على وجه الخصوص، نبني اثنين من الطبقات الرئيسية من النظم القائمة على النقل لدراسة كيفية استخدام ترابط الأداء الترجمة.النظام الأساسي يضم النموذج الذي تم تدريبه مسبقا على زوج لغة ذات صلة ونظام قابل للتناقض بشكل جيد-قم بإلغاء التدريب مسبقا على زوج لغة غير ذات صلة.تبين تجاربنا أنه على الرغم من أن المرتبطة ليست ضرورية لنقل التعلم للعمل، إلا أنها تنفذ أداء نموذجي.
يتناول هذا البحث بالتحليل لآليات التكامل التشغيلي بين المنطقة الحرة المرفئية و الميناء البحري ، استناداً الى دراسة حالة للمنطقة الحرة و ميناء جبل علي ، و التى تم اختيارها اعتباراً للمركز المرموق الذى يحتله ميناء جبل علي و المنطقة الحرة فى الصدارة الع ربية و العالمية ، فتستهل الورقة البحثية بالتعاريف المختلفة لأنواع المناطق الحرة ، ثم تقديم شكل إيضاحى لآليات التكامل التشغيلى بين الميناء البحري و المنطقة الحرة ، و منه ينتقل الباحث إلى تحليل الوضع الراهن لعمل المنطقة الحرة و التي تتكامل مع ميناء جبل علي ، و قد بين البحث نوعيات حركة البضائع ، و الإجراءات الجمركية للأنواع المختلفة من البوالص بالمنطقة الحرة فى جبل علي ، و النظم الإلكترونية المطبقة فى إجراءات الخدمات الخاصة بوكلاء الشحن البحري و مخلصّي البضائع و أثرها علي عملية التكامل التشغيلي بين الميناء و المنطقة الحرة فى جبل علي ، و قد تم إجراء دراسة إحصائية عن العلاقة بين أعداد الحاويات المتداولة فى الميناء و المنطقة الحرة و الصادرات و الواردات و الناتج المحلي الإجمالي ، و خلص البحث إلى عدد من النتائج و التوصيات أهمها حتمية وجود آليات للتكامل التشغيلي بين المنطقة الحرة و الميناء مع تطبيق النظم الإلكترونية لإجراءات حركة البضائع و الحاويات باعتبارها من أهم متطلبات تحقيق ذلك التكامل و نجاحه.
نماذج الترجمة العصبية متعددة اللغات تعامل مع لغة مصدر واحدة في وقت واحد.ومع ذلك، فقد أظهر العمل السابق أن الترجمة من لغات مصدر متعددة تعمل على تحسين جودة الترجمة.تختلف عن الأساليب الحالية على الترجمة المتعددة المصدر التي تقتصر على سيناريو الاختبار حي ث تتوفر جمل مصدر مواز من لغات متعددة في وقت الاستدلال، نقترح تحسين الترجمة متعددة اللغات في سيناريو أكثر شيوعا من خلال استغلال جمل المصدر الاصطناعية من اللغات المساعدة.نحن ندرب نموذجنا على شركة Synthetic متعددة المصدر، وتطبيق اخفاء عشوائي لتمكين الاستدلال المرن مع مدخلات مصدر واحد أو مصدر ثنائي.تجارب واسعة النطاق على الصينية / الإنجليزية - اليابانية ومقاييس الترجمة متعددة اللغات على نطاق واسع تشير إلى أن طرازنا يتفوق على خط الأساس متعدد اللغات بشكل كبير من أعلى إلى +4.0 بلو مع أكبر تحسينات على أزواج اللغات المنخفضة أو البعيدة.
يركز استخراج علاقات قليلة (FSRE) على الاعتراف بعلاقات جديدة من خلال التعلم مع مجرد حفنة من الحالات المشروح.تم اعتماد التعلم التلوي على نطاق واسع لمثل هذه المهمة، والتي تتدرب على إنشاء مهام قليلة من الرصاص بشكل عشوائي لتعلم تمثيلات بيانات عامة.على الر غم من النتائج المثيرة للإعجاب التي تحققت، لا تزال النماذج الحالية تؤدي دون التفاادم عند التعامل مع مهام FSRE الثابتة، حيث تكون العلاقات محببة ومتشابهة لبعضها البعض.نقول هذا إلى حد كبير لأن النماذج الحالية لا تميز المهام الثابتة من سهلة في عملية التعلم.في هذه الورقة، نقدم نهجا جديدا يعتمد على التعلم المتعاقل الذي يتعلم تمثيلات أفضل من خلال استغلال معلومات الملصقات العلاقة.نحن أيضا تصميم طريقة تسمح للنموذج بتعلم تكيف كيفية التركيز على المهام الثابتة.تجارب على مجموعة بيانات قياسية توضح فعالية طريقتنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا