تعد أساليب تفسير ما بعد الهوك فئة مهمة من الأساليب التي تساعد في فهم الأساس المنطقي وراء قرار النموذج المدربين.ولكن ما مدى فائدة المستخدمين النهائي نحو تحقيق مهمة معينة؟في هذه الورقة الرؤية، نقول الحاجة إلى معيار لتسهيل تقييمات فائدة أساليب تفسير ما بعد المخصص.كخطوة أولى لهذه الغاية، فإننا نعدد العقارات المرغوبة التي يجب أن تمتلكها مثل هذا المعيار لمهمة تصحيح التصحيح النصوص النصية.بالإضافة إلى ذلك، نسلط الضوء على أن هذا المعيار يسهل ليس فقط تقييم فعالية التفسيرات ولكن أيضا كفاءتها.
Post-hoc explanation methods are an important class of approaches that help understand the rationale underlying a trained model's decision. But how useful are they for an end-user towards accomplishing a given task? In this vision paper, we argue the need for a benchmark to facilitate evaluations of the utility of post-hoc explanation methods. As a first step to this end, we enumerate desirable properties that such a benchmark should possess for the task of debugging text classifiers. Additionally, we highlight that such a benchmark facilitates not only assessing the effectiveness of explanations but also their efficiency.
المراجع المستخدمة
https://aclanthology.org/
تعتمد نماذج التعلم العميق الحديثة لمعالجة اللغة الطبيعية بشكل كبير على كميات كبيرة من النصوص المشروح.ومع ذلك، قد يكون الحصول على مثل هذه النصوص صعبة عندما تحتوي على معلومات شخصية أو سرية، على سبيل المثال، في المجالات الصحية أو القانونية.في هذا العمل،
منطق العموم الزمني هي مهمة صعبة لأنها تتطلب المعرفة الزمنية عادة غير صريحة في النص.في هذا العمل، نقترح نموذج فرقة لسبب المنظمات الزمنية.يعتمد نموذجنا على تمثيلات سياقية مدربة مسبقا من نماذج اللغة القائمة على المحولات (IE، Bert)، وعلى مجموعة متنوعة من
توضيحات تناقض توضيح سبب حدوث حدث قد حدث على عكس آخر.إنهم بطبيعتهم بديهية للبشر لكل من الإنتاج والفهم.نقترح طريقة لإنتاج تفسيرات صغيرة في الفضاء الكامن، من خلال إسقاط تمثيل الإدخال، بحيث يتم التقاط الميزات التي تفرق إلا عن قرارات محتملة.يسمح التعديل ل
يتم تدريب معظم نماذج تقدير الجودة الحالية (QE) للترجمة الآلية وتقييمها في بيئة إشراف بالكامل تتطلب كميات كبيرة من بيانات التدريب المسمى. ومع ذلك، يمكن أن تكون الحصول على البيانات المسمى باهظة الثمن وتستغرق وقتا طويلا. بالإضافة إلى ذلك، قد تتعرض بيانا
اجتذبت تحليل المعنويات الاهتمام المتزايد في التجارة الإلكترونية. تعتبر أسابير المشاعر الأساسيين لمراجعات المستخدمين ذات قيمة كبيرة لذكاء الأعمال. تحليل المعنويات الفئة في الأساس (ACSA) ومراجعة التنبؤ بالتصنيف (RP) هما مهامان أساسيان للكشف عن أسطاطات