المتوسط الكلي: أنواع نادرة مهمة أيضا


الملخص بالعربية

في حين أن مقاييس تقييم المستوى التقليدي للترجمة الآلية (MT) ترتبط بشكل جيد مع الطلاقة، فإنها تكافح لتعكس كفاية.برزت مقاييس MT مقرها النموذجية المدربة على الأحكام الإنسانية على مستوى القطاع كحل جذابة بسبب نتائج الارتباط القوي.ومع ذلك، فإن هذه النماذج تتطلب إعادة تدريب مكلفة محتملة للنطاقات واللغات الجديدة.علاوة على ذلك، فإن قراراتها غير شفافة بطبيعتها ويبدو أنها تعكس التحيزات غير المرغوب فيها.نستكشف مقياس مصنف من النوع البسيط، Macrof1، ودراسة تطبيقه على تقييم MT.نجد أن Macrof1 تنافسية على التقييم المباشر، وتتفوق على الآخرين في الإشارة إلى أداء مهام استرجاع المعلومات عبر اللغات المتبادلة.علاوة على ذلك، نوضح أن Macrof1 يمكن استخدامها لتقارن الترجمة الآلية العذبة الخاضعة للإشراف والكشف عن الاختلافات النوعية المهمة في مخرجات الأساليب.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث