توضيحات تناقض توضيح سبب حدوث حدث قد حدث على عكس آخر.إنهم بطبيعتهم بديهية للبشر لكل من الإنتاج والفهم.نقترح طريقة لإنتاج تفسيرات صغيرة في الفضاء الكامن، من خلال إسقاط تمثيل الإدخال، بحيث يتم التقاط الميزات التي تفرق إلا عن قرارات محتملة.يسمح التعديل لدينا بسلوك نموذجي للنظر في التفكير المتعرج فقط، والكشف عن جوانب المدخلات مفيدة لقرارات ومعاكضة معينة.يمكن أن تجيب تفسيراتنا الصنع للإجابة على أي تسمية، ومعها الملصق البدائل، هي ميزة إدخال معينة مفيدة.نحن ننتج تفسيرات صغيرة عبر كل من إسناد مفهوم مجردة رفيع المستوى ومستوى المدخلات / المدخلات منخفضة المستوى لإسناد معايير تصنيف NLP.توضح نتائجنا قدرة التفسيرات على نطاق واسع لتوفير إمكانية الترجمة الترجمة الفورية للقرارات النموذجية.
Contrastive explanations clarify why an event occurred in contrast to another. They are inherently intuitive to humans to both produce and comprehend. We propose a method to produce contrastive explanations in the latent space, via a projection of the input representation, such that only the features that differentiate two potential decisions are captured. Our modification allows model behavior to consider only contrastive reasoning, and uncover which aspects of the input are useful for and against particular decisions. Our contrastive explanations can additionally answer for which label, and against which alternative label, is a given input feature useful. We produce contrastive explanations via both high-level abstract concept attribution and low-level input token/span attribution for two NLP classification benchmarks. Our findings demonstrate the ability of label-contrastive explanations to provide fine-grained interpretability of model decisions.
المراجع المستخدمة
https://aclanthology.org/
من الناحية المثالية، يشارك الأشخاص الذين ينقلون معا في الفضاء الداخلي المعقد نموذجا عقليا يسهل التفسير.تقارير الورقة هذه عن نظام تحكم روبوت يعتمد طراز العالم المعرفي على التمويل المكاني الذي يعمم على بياناته الإدراكية.بالنظر إلى وجود هدف، يقوم نظام ا
في هذه الورقة، نستكشف بناء تفسيرات لغة طبيعية للحصول على مطالبات الأخبار، بهدف مساعدة تطبيقات التحقق من الحقائق وتقييم الأخبار.نقوم بتجربة طريقتين: (1) طريقة استخراجية تستند إلى Textrank متحيز - خوارزمية فعالة من الموارد القائمة على الرسم البياني لاس
كيف يمكننا أن نولد تفسيرات موجزة لفهم القراءة متعددة القفز (RC)؟ يمكن اعتبار الاستراتيجيات الحالية لتحديد الجمل الداعمة كأخصات تركز على الأسئلة الاستخراجية لنص المدخلات. ومع ذلك، فإن هذه التفسيرات الاستخراجية ليست بالضرورة موجزة، وليس كافية على الأقل
على الرغم من أن النماذج العصبية قد أظهرت أداء قويا في مجموعات البيانات مثل SNLI، إلا أنها تفتقر إلى القدرة على التعميم خارج التوزيع (OOD).في هذا العمل، نقوم بصياغة عدد قليل من إعدادات التعلم ودراسة آثار تفسيرات اللغة الطبيعية على تعميم OOD.نحن نستفيد
تعد أساليب تفسير ما بعد الهوك فئة مهمة من الأساليب التي تساعد في فهم الأساس المنطقي وراء قرار النموذج المدربين.ولكن ما مدى فائدة المستخدمين النهائي نحو تحقيق مهمة معينة؟في هذه الورقة الرؤية، نقول الحاجة إلى معيار لتسهيل تقييمات فائدة أساليب تفسير ما