ترغب بنشر مسار تعليمي؟ اضغط هنا

الترجمة الآلية العصبية (NMT) حساسة لتحويل المجال. في هذه الورقة، نتعامل مع هذه المشكلة في إعداد تعليمي نشط حيث يمكننا أن نقضي ميزانية معينة في ترجمة البيانات داخل المجال، وتصفح تدريجيا نموذج NMT خارج المجال المدرب مسبقا على البيانات المترجمة حديثا. ع ادة ما تختار طرق التعلم النشطة الحالية ل NMT الجمل بناء على درجات عدم اليقين، ولكن هذه الأساليب تتطلب ترجمة مكلفة للجمل الكاملة حتى عندما تكون عبارات واحدة أو اثنين فقط في الجملة مفيدة. لمعالجة هذا القيد، نعيد فحص العمل السابق من حقبة الترجمة الآلية القائمة على العبارة (PBMT) التي حددت جمل كاملة، ولكن العبارات الفردية إلى حد ما. ومع ذلك، في حين أن دمج هذه العبارات في أنظمة PBMT كانت بسيطة نسبيا، إلا أنها أقل تافهة لأنظمة NMT، والتي يجب تدريبها على تسلسل كامل لالتقاط خصائص هيكلية أكبر للجمل الفريدة للمجال الجديد. للتغلب على هذه العقبات، نقترح تحديد كلا الجمل الكاملة والعبارات الفردية من البيانات غير المسبقة في المجال الجديد للتوجيه إلى المترجمين البشريين. في مهمة ترجمة باللغة الألمانية-الإنجليزية، تحقق نهج التعلم النشط لدينا تحسينات متسقة حول أساليب اختيار الجملة القائمة على عدم اليقين، وتحسين ما يصل إلى 1.2 نتيجة بلو على خطوط خطوط التعلم النشطة قوية.
نحن نستخدم مجموعة اختبار شبه آلية من أجل توفير تقييم لغوي محمول من أجل أنظمة الترجمة الآلية الحديثة. يشمل التقييم 18 الألمانية إلى الإنجليزية و 18 الإنجليزية إلى الألمانية، قدمت إلى مهمة مشتركة للترجمة بمؤتمر 2021 حول الترجمة الآلية. يضيف تقديمنا إلى إعدادات السنوات السابقة عن طريق إنشاء وتطبيق جناح اختبار واسع النطاق للغة الإنجليزية إلى الألمانية كزوج لغة جديدة. يسمح التقييم الراسخ في اكتشاف اختلافات كبيرة بين الأنظمة التي لا يمكن تمييزها من خلال التقييم المباشر لحملة التقييم البشرية. نجد أن معظم الأنظمة تحقق عقوبة جيدة في غالبية الظواهر اللغوية ولكن هناك عدد قليل من الظواهر مع دقة منخفضة، مثل التعابير، والمطبقة مشروط والمسندات الألمانية الناتجة. نظمتين تتمتعان بدقة اختبار أفضل بكثير في المتوسط ​​في المتوسط ​​الكلي في كل اتجاه لغة، عبر الإنترنت-W و Facebook-AI للألمانية إلى الإنجليزية والمرافقين وبرنامج Volctrans وعلى الإنترنت-W للإنجليزية إلى الألمانية. تظهر الأنظمة تحسنا مطردا مقارنة بالسنوات السابقة.
في هذه الورقة، نقدم طلبنا إلى مهمة المقاييس المشتركة: Robleurt (تحسين تدريب Bleurt).بعد التحقيق في التطورات الأخيرة المتمثلة في المقاييس التدريبية التدريبية، نستنتج عدة جوانب ذات أهمية حيوية للحصول على نموذج متري أداء جيدا من قبل: 1) الاستفادة المشتر كة مزايا النموذج المشترك بين المصدر والنموذج المرجعي فقط، 2) ما قبل التدريب المستمرنموذج مع أزواج البيانات الاصطناعية الضخمة، و 3) ضبط النموذج مع استراتيجية تنظيف البيانات.تظهر النتائج التجريبية أن نموذجنا يصل إلى ارتباطات حديثة مع التعليقات البشرية البشرية WMT2020 عند 8 من أزواج لغة 10 إلى الإنجليزية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا