ترغب بنشر مسار تعليمي؟ اضغط هنا

نحو تحسين التدريب الخصم لنماذج NLP

Towards Improving Adversarial Training of NLP Models

175   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تدريب الخصم، طريقة لتعلم الشبكات العصبية العميقة القوية، تضم أمثلة خصومة أثناء التدريب. ومع ذلك، فإن الأساليب الحديثة لتوليد أمثلة allp adversarial تنطوي على البحث عن الفروضي وترميز الجملة باهظة الثمن لتقييد الحالات التي تم إنشاؤها. نتيجة لذلك، لا يزال يمثل تحديا لاستخدام التدريب المشدود الفانيليا لتحسين أداء نماذج NLP، والفوائد غير مرئية بشكل أساسي. تقترح هذه الورقة عملية تدريبية بسيطة ومحسنة من الفانيليا العدائية لنماذج NLP، والتي نستها المهاجمة على التدريب (A2T). الجزء الأساسي من A2T هو هجوم استبدال كلمة جديدة وأرخص محسن لتدريب الفانيليا الخصم. نحن نستخدم A2T لتدريب برت ونماذج روبرتا على مجموعة بيانات IMDB والطماطم الفاسدة والشبكة الصلبة و SNLI. تظهر نتائجنا تجريبيا أنه من الممكن تدريب نماذج NLP قوية باستخدام خصم أرخص بكثير. نوضح أن التدريب الصادق للفانيليا مع A2T يمكن أن يحسن متانة نموذج NLP للهجوم الذي تم تدريبه في الأصل مع النموذج الذي يدافع عنه أيضا ضد أنواع أخرى من هجمات استبدال الكلمات. علاوة على ذلك، نظهر أن A2T يمكن أن تحسن الدقة القياسية لنماذج NLP وتعميم المجال المتبادل والتفسيرية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم خوارزمية تدريبية مستهدفة بسيطة ولكنها فعالة (TAT) لتحسين التدريب الخصم لفهم اللغة الطبيعية.الفكرة الرئيسية هي أن تخطئ الأخطاء الحالية وتحديد أولويات التدريب على الخطوات إلى حيث يخطئ النموذج أكثر.تظهر التجارب أن TAT يمكن أن تحسن بشكل كبير الدقة ع لى التدريب الخصم القياسي على الغراء وتحقيق نتائج جديدة من أحدث النتائج في XNLI.سيتم إصدار شفرة لدينا عند قبول الورقة.
لقد أثبتت تدريب الخصم (AT) كطريقة تنظيمي فعاليتها على المهام المختلفة.على الرغم من وجود تطبيقات ناجحة في بعض مهام NLP، إلا أن الخصائص المميزة لمهام NLP لم يتم استغلالها.في هذه الورقة، نهدف إلى تطبيق مهام فهم القراءة (MRC).علاوة على ذلك، فإننا نتكيف م ع مهام MRC من خلال اقتراح طريقة تدريبية عديدة جديدة تسمى PQAT التي تتعلق بمصفوفة التضمين بدلا من ناقلات Word.للتمييز بين أدوار الممرات والأسئلة، يستخدم PQAT مصفوفات إضافية P / Q Directding إضافية لجمع الاضطرابات العالمية للكلمات من الممرات والأسئلة بشكل منفصل.نحن نختبر الطريقة على مجموعة واسعة من مهام MRC، بما في ذلك RC الاستخراجية المستندة إلى RC واستخراج RC متعددة الخيارات.تظهر النتائج أن التدريب الخصم فعال عالميا، ويحسن PQAT الأداء.
تصحيح الأخطاء المجردة نموذج تعلم الجهاز أمر صعب للغاية حيث يشمل الخطأ عادة بيانات التدريب وعملية التعلم.يصبح هذا أكثر صعوبة بالنسبة لطراز التعلم العميق غير المشفح إذا لم يكن لدينا أدنى فكرة عن كيفية عمل النموذج بالفعل.في هذا الاستطلاع، نراجع الأوراق التي تستغلها تفسيرات لتمكين البشر من تقديم ملاحظات وتصحيح نماذج NLP.نسمي هذه المشكلة تصحيح الأخطاء البشرية القائم على التفسير (EBHD).على وجه الخصوص، نقوم بتصنيف وناقش العمل الحالي على طول ثلاثة أبعاد من EBHD (سياق الأخطاء، وسير العمل، والإعداد التجريبي)، تجميع النتائج حول كيفية تأثير مكونات EBHD على مقدمي التعليقات، وتسليط الضوء على المشاكل المفتوحة التي يمكن أن تكون اتجاهات بحثية في المستقبل.
حققت نماذج اللغة المدربة مؤخرا (LMS) أداء قويا عند ضبطها على المعايير الصعبة مثل SuperGlue.ومع ذلك، يمكن أن يعاني الأداء عندما يكون هناك عدد قليل جدا من الأمثلة المسمىة للضبط بشكل جيد.يعد تدريب نمط استغلال النمط (PET) نهجا مؤخرا أن أنماط أنماط لتعلم القليل من الطلقات.ومع ذلك، يستخدم الحيوانات الأليفة البيانات الخاصة بمهام المهام غير المسبقة.في هذه الورقة، نركز على عدد قليل من التعلم بالرصاص دون أي بيانات غير مبررة وإدخال Adapet، والذي يعدل هدف الحيوانات الأليفة لتوفير إشراف كثيف أثناء الضبط.نتيجة لذلك، تتفوق Adapet على الحيوانات الأليفة على SuperGlue دون أي بيانات غير محددة من المهام.
يشكل التعميم الشامل مسألة مهمة للكشف عن الموقف (SD).في هذه الورقة القصيرة، نقوم بالتحقيق في SD الصلبة العدسة، حيث يتم الاستفادة من المعرفة من البيانات التي تم إنشاؤها من قبل المستخدم لتحسين الأخبار SD على أهداف غير مرئية أثناء التدريب.نقوم بتنفيذ شبك ة مخدرة قائمة على Bert وتظهر تحسينات الأداء التجريبية على مجموعة من خطوط الأساس القوية.بالنظر إلى وفرة البيانات التي تم إنشاؤها من قبل المستخدم، والتي تكون أقل تكلفة بكثير لاسترداد وتعليقها من المقالات الإخبارية، فإن هذا يشكل اتجاها بحثا واعدا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا