تقييم النمذجة التماسك المستند

نشر في جمعية اللغويات الحاسوبية ACL بتاريخ 2021 في مجال الذكاء الاصناعي والبحث باللغة English تحميل البحث

الملخص بالعربية

الملخص بينما طردت نماذج اللغة المحددة (LMS) مكاسب مثيرة للإعجاب على المهام المورفو والدلية، وقدرتها على نموذج الخطاب والظواهر البراغماتية أقل وضوحا.كخطوة نحو فهم أفضل لقدرات النمذجة خطابها، نقترح مهمة كشف التسلل.ندرس أداء مجموعة واسعة من LMS المحدد مسبقا على مهمة الكشف هذه للغة الإنجليزية.تفتقر إلى مجموعة بيانات للمهمة، ونحن نقدم DataSet Inteded Inteded، وهي عبارة عن بيانات الكشف عن عقوبة الدخيل الرواية، والتي تحتوي على 170،000+ مستندات مصنوعة من مقالات أخبار Wikipedia و CNN الإنجليزية.تظهر تجاربنا أن LMS المسبدة مسبقا تؤدي بشكل مثير للإعجاب في التقييم داخل المجال، بل تواجه انخفاضا كبيرا في إعداد المجال المتبادل، مما يشير إلى قدرة تعميم محدودة.نتائج أخرى على مجموعة بيانات مسبار لغوية جديدة تظهر أن هناك مجالا كبيرا للتحسين، خاصة في إعداد المجال المتقاطع.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث