ترغب بنشر مسار تعليمي؟ اضغط هنا

تعلم نموذج الترجمة متعددة اللغات ومتعدد اللغات يمثل تحديا لأن البيانات غير المتجانسة والمخطورة تجعل النموذج تتلاقص بشكل غير متسق على مختلف كوربورا في العالم الحقيقي. تتمثل هذه الممارسة الشائعة في ضبط حصة كل جثة في التدريب، بحيث يمكن أن تستفيد عملية ا لتعلم الحالات المتوازنة والموارد المنخفضة من الموارد العالية. ومع ذلك، عادة ما تعتمد أساليب موازنة التلقائي عادة على الخصائص داخل ومشتركة بين البيانات، والتي عادة ما تكون غير مرغقة أو تتطلب من الشاورات البشرية. في هذا العمل، نقترح نهجا، مواد متعددة، أن ضبط استخدام بيانات التدريب بشكل حيوي استنادا إلى عدم اليقين في النموذج على مجموعة صغيرة من البيانات النظيفة الموثوقة للترجمة متعددة الكائنات. نحن تجارب مع فئتين من تدابير عدم اليقين في تعدد اللغات (16 لغة مع 4 إعدادات) وإعدادات متعددة النجانات (4 للمجال في المجال و 2 للخارج على الترجمة الإنجليزية-الألمانية) وإظهار نهجنا متعدد الاستخدامات بشكل كبير خطوط الأساس، بما في ذلك الاستراتيجيات الثابتة والديناميكية. نقوم بتحليل النقل عبر المجال وإظهار نقص الأساليب القائمة على الاستقرار والمشاكل.
تقوم الترجمة الآلية المتزامنة (Simt) بإنشاء ترجمة قبل قراءة جملة المصدر بأكملها وبالتالي يجب عليها التجانس بين جودة الترجمة والكمول. للوفاء بمتطلبات جودة الترجمة المختلفة والكمون في التطبيقات العملية، عادة ما تحتاج الأساليب السابقة إلى تدريب نماذج SI MT متعددة لمستويات الكمون المختلفة، مما يؤدي إلى تكاليف حسابية كبيرة. في هذه الورقة، نقترح نموذجا عالميا SIMT مع سياسة مثالية من الخبراء وينظر K لتحقيق أفضل جودة الترجمة تحت الكمون التعسفي مع نموذج واحد مدرب فقط. على وجه التحديد، توظف طريقتنا اهتماما متعدد الأطراف لإنجاز مزيج الخبراء حيث يتم التعامل مع كل رأس كخبير الانتظار الخاص به برقم كلمات الانتظار الخاصة به، وبالنظر إلى مزيد من مدخلات الكمون ومشروعات المصدر، يتم تعديل أوزان الخبراء لإنتاج أفضل الترجمة. تظهر التجارب في ثلاث مجموعات البيانات أن أسلوبنا تتفوق على جميع خطوط الأساس القوية بموجب زينة مختلفة، بما في ذلك السياسة التكيفية الحديثة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا