ترغب بنشر مسار تعليمي؟ اضغط هنا

أصبح نموذج الترجمة الآلي غير المقترح (MT)، الذي لديه القدرة على أداء MT دون جمل متوازية باستخدام كورسا مماثلة، نهجا واعدا لتطوير MT بلغات الموارد المنخفضة.ومع ذلك، فإن غالبية الدراسات في MT غير المنشأة قد نظرت في أزواج لغوية غنية بالموارد ذات خصائص ل غوية مماثلة.في هذه الورقة، نحقق في فعالية نماذج MT غير الخاضعة للكشف عن كائن قابلة للمقارنة من مانيبوري.Manipuri هي لغة موارد منخفضة لها خصائص لغوية مختلفة من اللغة الإنجليزية.تركز هذه الورقة على تحديد التحديات في بناء نماذج MT غير المقدمة على الكائنات القابلة للمقارنة.من الملاحظات التجريبية المختلفة، من الواضح أن تطوير MT على Corpus المقارنة باستخدام الأساليب غير المعروضة غير ممكن.علاوة على ذلك، تحدد الورقة أيضا الاتجاهات المستقبلية لتطوير MT فعالة لزوج لغة مانيبوري والإنجليزية في ظل سيناريوهات غير مخالفة.
في الترجمة الآلية، يعد إعداد Corpus أحد المهام الحاسمة، خاصة لأزواج منخفضة.في بلدان متعددة اللغات مثل الهند، تلعب الترجمة الآلية دورا حيويا في التواصل بين الأشخاص الذين لديهم خلفيات لغوية مختلفة.تتوفر أنظمة الترجمة الآلية المتوفرة عبر الإنترنت من قبل Google و Microsoft والتي تشمل لغات مختلفة تفتقر إلى الدعم لغلق Khasi، والتي يمكن اعتبارها LonResource.نظرة عامة على هذه الورقة تطوير ENKHCCORP1.0، وهي كوربوس للإنجليزية - Khasi Pair، ونفذت أنظمة أساسية للترجمة الإنجليزي Englishtokhasi و Khasitoenglish بناء على نهج ترجمة الآلات العصبية.
تعرض نهج الترجمة الآلية العصبية (NMT) التي توظف بيانات أحادية الأحادية تحسينات ثابتة في الظروف الغنية بالموارد. ومع ذلك، فإن التقييمات باستخدام لغات العالم الحقيقي LowResource لا تزال تؤدي إلى أداء غير مرضي. يقترح هذا العمل نهج نمذجة Zeroshot NMT NMT NMT يتعلم بدون افتراض لغة محورية الآن بتقاسم البيانات الموازية مع المصدر الصفر واللغات المستهدفة. يعتمد نهجنا على ثلاث مراحل: التهيئة من أي نموذج NMT المدرب مسبقا مراقبة اللغة المستهدفة على الأقل، وتعزيز جوانب المصدر التي تستفيد من بيانات الأحادية المستهدفة، وتعلم تحسين النموذج الأولي إلى زوج الطلقة الصفرية، حيث الأخيران تشكل دورة selflearyling. تظهر النتائج التجريبية التي تنطوي على أربعة متنوعة (من حيث أسرة اللغة، البرنامج النصي ورابطتها) أزواج صفرية بالرصاص فعالية نهجنا مع ما يصل إلى +5.93 لتحسين بلو على خط الأساس ثنائي اللغة الخاضع للإشراف. بالمقارنة مع NMT غير المدعومة، يلاحظ التحسينات المستمرة حتى في إعداد عدم تطابق المجال، مما يدل على قابلية استخدام طريقتنا.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا