تقييم Multiway Multiling NMT في اللغات التركية


الملخص بالعربية

على الرغم من العدد المتزايد من أنظمة الترجمة الآلية الكبيرة والشاملة (MT)، فقد تم تقييد تقييم هذه الأساليب بلغات مختلفة بسبب عدم وجود كورسا موازية عالية الجودة بالإضافة إلى المشاركة مع الأشخاص الذين يتحدثون هذه اللغات. في هذه الدراسة، نقدم تقييم مناهج أحدث من النهج التدريبية لتدريب وتقييم أنظمة MT في 22 لغة من عائلة اللغات التركية، معظمها يتم استكشافها بشكل كبير. أولا، نعتمد كوربوس سمسم مع بعض التحسينات الرئيسية على التدريب ومجموعات التقييم. ثم، ندرب 26 خطوط خطوط خطوط خطية ثنائية اللغة بالإضافة إلى نموذج MT (MNMT) متعدد الاتجاهات باستخدام Corpus وأداء تحليل مكثف باستخدام المقاييس التلقائية وكذلك التقييمات البشرية. نجد أن نموذج MNMT يتفوق على جميع خطوط الأساس الثنائية الثالثة تقريبا في مجموعات الاختبار خارج المجال وتؤدي النموذج الموجود على مهمة المصب من زوج واحد يؤدي أيضا إلى زيادة كبيرة في الأداء في كل من سيناريوهات منخفضة وعالية الموارد. يشير تحليلنا اليقظ لمعايير التقييم لنماذج MT باللغات التركية أيضا إلى ضرورة مزيد من البحث في هذا الاتجاه. نقوم بإصدار تقسيم Corpus، ومجموعات الاختبار وكذلك النماذج للجمهور.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث