ترغب بنشر مسار تعليمي؟ اضغط هنا

التأثير على ضبط: إزالة الارتباطات الزائفة عبر الإسناد المثيل وتحديثات مدفوعة بالمثيل

Influence Tuning: Demoting Spurious Correlations via Instance Attribution and Instance-Driven Updates

220   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

من بين القيود الأكثر أهمية في نماذج NLP التعليمية العميقة هي عدم قابلية الترجمة الشفوية، واعتمادها على الارتباطات الزائفة.اقترح العمل السابق مناهج مختلفة لتفسير نماذج الصندوق الأسود للكشف عن الارتباطات الزائفة، ولكن تم استخدام البحث في المقام الأول في سيناريوهات تفاعل الكمبيوتر البشري.لا يزال لا يزال غير متوقع سواء أم لا يمكن استخدام تفسيرات النمطية أو كيفية استخدامها تلقائيا "ميزات مربكة".في هذا العمل، نقترح التأثير على الضبط --- الإجراء الذي يرفع تفسيرات نموذجية لتحديث معلمات النموذج نحو تفسير معقول (بدلا من التفسير الذي يعتمد على الأنماط الزائفة في البيانات) بالإضافة إلى تعلم التنبؤ بالملصقات المهمة.نظرا لأنه في برنامج إعداد خاضع للرقابة، يمكن أن يساعد التأثير على الضبط في إزالة النموذج من الأنماط الزائفة في البيانات، مما يتفوق بشكل كبير على أساليب خط الأساس التي تستخدم التدريب الخصم.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يعمل العمل الحديث في محاولات تعدين الحجة عبر الموضوعات لتعلم النماذج التي تعزز عبر الموضوعات بدلا من الاعتماد فقط على الارتباطات الزائفة داخل الموضوع.نحن ندرس فعالية هذا النهج من خلال تحليل إخراج النماذج ذات المهمة الفردية ومتعدد المهام للتطوير عبر ا لموضوعات التعدين، من خلال مزيج من تقريبية خطية من حدود قراراتهم، وتجميع الميزات اليدوية، أمثلة التحدي، والاعتبارات عبر المدخلاتكلمات.من المستغرب أن نوضح أن النماذج عبر الموضوعات لا تزال تعتمد في الغالب على ارتباطات زائفة وتعميم فقط داخل مواضيع مرتبطة ارتباطا وثيقا، على سبيل المثال، نموذج مدرب فقط على الكلمات الفئة المغلقة وبعض الكلمات المفتوحة الشائعة تفوقت على حالة منالفن المتبادل نموذج المواضيع المستهدفة البعيدة.
المعردات التفسيرية مجردة للتوقعات النموذجية هي حاسمة في التطبيقات العملية.نحن نطور النماذج العصبية التي تمتلك عملية استنتاجية مفسضة لتحليل التبعية.تتبنى نماذجنا الاستدلال المستند إلى المثيل، حيث يتم استخراج حواف التبعية ومسمى من خلال مقارنةها بالحواف في مجموعة تدريبية.يتم استخدام حواف التدريب صراحة للتنبؤات؛وبالتالي، من السهل فهم مساهمة كل حافة إلى التنبؤات.تظهر تجاربنا أن النماذج القائمة على مثيل لدينا تحقق دقة تنافسية مع النماذج العصبية القياسية ولديها المعقول المعقولة من التفسيرات القائمة على المثيل.
تعمل الأعمال الموجودة على استخراج المعلومات (IE) بشكل أساسي المهام الرئيسية الأربعة بشكل منفصل (إبلاغ الكيان بالاعتراف بالاعتراف، واستخراج العلاقة، والكشف عن الحدث، واستخراج الوسيطة)، وبالتالي الفشل في الاستفادة من التبعيات بين المهام. تقدم هذه الورق ة نموذجا تعليميا عميقا جديدا لحل المهام الأربع الأربعة في وقت واحد في نموذج واحد (يسمى Fourie). بالمقارنة مع عدد قليل من العمل السابق في أداء مهام IE المشتركة، تتميز Fourie بمساهمات جديدة لالتقاط التبعيات بين المهام. أولا، في مستوى التمثيل، نقدم رسم بياني تفاعل بين مثيلات المهام الأربعة المستخدمة لإثراء تمثيل التنبؤ بمثيل واحد مع أولئك من مثيلات المهام الأخرى ذات الصلة. ثانيا، على مستوى العلامة، نقترح رسم بياني للاعتماد لأنواع المعلومات في المهام الأربعة IE التي تلتقط الاتصالات بين الأنواع المعبر عنها في جملة مدخلات. يتم تقديم آلية تنظيمية جديدة لإنفاذ الاتساق بين الرسوم البيانية الذهبية المتوقعة والتنبؤ بها لتحسين تعلم التمثيل. نظهر أن النموذج المقترح يحقق الأداء الحديثة للمفصل IE على كل من إعدادات التعلم أحادية اللغات وغير اللغوية بأثلاثة لغات مختلفة.
إن جيل البيانات إلى النص (D2T) في المجال الطبي الطبيعي هو واعد - ولكن في الغالب غير مستكشفة - مجال البحث.هنا، نطبق النماذج العصبية لتوليد D2T إلى مجموعة بيانات حقيقية تتكون من منشورات الحزمة من الأدوية الأوروبية.نظهر أن المحولات التي تم ضبطها بشكل جي د قادرون على توليد نص واقعي متعدد الجملة من البيانات في المجال الطبي الطبيعي، ولكن لها قيود مهمة.ونحن نطلق أيضا عن مجموعة بيانات جديدة (bioileaflets) لنماذج جيل D2T القياسية في المجال الطبي الطبيعي.
اقترح مخطط التعلم الخاص Texthide مؤخرا لحماية البيانات النصية الخاصة أثناء مرحلة التدريب عبر ترميز المثيل المزعوم.نقترح هجوم إعادة الإعمار الجديد لكسر Texthide من خلال استعادة بيانات التدريب الخاص، وبالتالي تكشف النقاب عن مخاطر الخصوصية على ترميز الم ثيل.لقد صادقنا تجريبيا فعالية هجوم إعادة الإعمار مع مجموعات بيانات شائعة الاستخدام لتصنيف الجملة.إن هجومنا ستقدم تطوير التعلم في الحفاظ على الخصوصية في سياق معالجة اللغة الطبيعية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا