ترغب بنشر مسار تعليمي؟ اضغط هنا

التشخيص الذاتي والدوائر الذاتية: اقتراح لتقليل التحيز القائم على Corpus في NLP

Self-Diagnosis and Self-Debiasing: A Proposal for Reducing Corpus-Based Bias in NLP

276   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مجردة ⚠ تحتوي هذه الورقة على مطالبات ونواتج النماذج المسيئة في الطبيعة. عند التدريب على الزحف الكبيرة وغير المرفقة من الإنترنت، تلتقط نماذج اللغة وإعادة إنتاج جميع أنواع التحيزات غير المرغوب فيها التي يمكن العثور عليها في البيانات: أنها غالبا ما تولد لغة عنصرية أو جنسية أو عنيفة أو غير سامة. نظرا لأن النماذج الكبيرة تتطلب ملايين الأمثلة التدريبية لتحقيق أداء جيد، فمن الصعب منعها تماما من التعرض لمثل هذا المحتوى. في هذه الورقة، نوضح أولا في العثور على إيجاد مفاجئ: تعترف نماذج اللغة المحددة، إلى درجة كبيرة، تحيزاتهم غير المرغوب فيها وسمية المحتوى الذي ينتجونه. نشير إلى هذه القدرة كتشخيص الذاتي. بناء على هذا النتيجة، نقترح خوارزمية فك تشفير ذلك، بالنظر إلى وصف نصي فقط للسلوك غير المرغوب فيه، يقلل من احتمال إنتاج نموذج لغة ينتج نصا مشكلة. نشير إلى هذا النهج كدخل ذاتي. لا يعتمد الدخل الذاتي على قوائم Word يدويا يدويا، ولا يتطلب الأمر أي بيانات تدريبية أو تغييرات على معلمات النموذج. في حين أننا لا نقضاء بأي حال من الأحوال قضية نماذج اللغة التي تولد نص متحيز، فإننا نعتقد أن نهجنا خطوة مهمة في هذا الاتجاه



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الشبكات العصبية هي طريقة أحدثت لآلة التعلم للعديد من المشاكل في NLP.نجاحهم في الترجمة الآلية ومهام NLP الأخرى هي ظاهرة، لكن قابلية الترجمة الشفوية تحديا.نريد معرفة كيف تمثل الشبكات العصبية معنى.من أجل القيام بذلك، نقترح فحص توزيع المعنى في تمثيل المس احة المتجهة للكلمات في الشبكات العصبية المدربة لمهام NLP.علاوة على ذلك، نقترح النظر في نظريات المعنى المختلفة في فلسفة اللغة وإيجاد منهجية ستمكننا من توصيل هذه المجالات.
تم اعتبار تحيز التعرض مشكلة مركزية لنماذج اللغة التراجعية التلقائية (LM). وهذا يدعي أن المعلم يجبر سيؤدي إلى تشويه جيل وقت الاختبار تدريجيا بسبب تباين توليد التدريب. على الرغم من أن الكثير من الخوارزميات قد اقترحت تجنب التغلب على المعلم وبالتالي تخفي ف تحيز التعرض، إلا أن هناك ضئيل من العمل الذي يظهر مدى خطورة مشكلة تحيز التعرض في الواقع. في هذا العمل، نركز على مهمة توليد اللغة المفتوح العضوية، اقترح المقاييس لتحديد تأثير تحيز التعرض في جوانب الجودة والتنوع والاتساق. الحدس الرئيسي الخاص بنا هو أنه إذا قمت بإطعام بادئات بيانات الحقيقة الأرضية (بدلا من البادئات الناتجة عن النموذج نفسه) في النموذج واطلب من مواصلة الجيل، يجب أن يصبح الأداء أفضل بكثير لأن التناقض في توليد التدريب في البادئة إزالة. يتم إجراء التقييمات التلقائية والإنسانية في تجاربنا. على عكس الاعتقاد الشعبي بتحيز التعرض، نجد أن التشويه الناجم عن تناقض البادئة محدود، ولا يبدو أنه تدريجي خلال الجيل. علاوة على ذلك، يكشف تحليلنا عن قدرة مثيرة للاهتمام للانكماش الذاتي ل LM، والتي نفترض أنها تكافؤها لتكون مواجهة الآثار الضارة من تحيز التعرض.
تصحيح الأخطاء المجردة نموذج تعلم الجهاز أمر صعب للغاية حيث يشمل الخطأ عادة بيانات التدريب وعملية التعلم.يصبح هذا أكثر صعوبة بالنسبة لطراز التعلم العميق غير المشفح إذا لم يكن لدينا أدنى فكرة عن كيفية عمل النموذج بالفعل.في هذا الاستطلاع، نراجع الأوراق التي تستغلها تفسيرات لتمكين البشر من تقديم ملاحظات وتصحيح نماذج NLP.نسمي هذه المشكلة تصحيح الأخطاء البشرية القائم على التفسير (EBHD).على وجه الخصوص، نقوم بتصنيف وناقش العمل الحالي على طول ثلاثة أبعاد من EBHD (سياق الأخطاء، وسير العمل، والإعداد التجريبي)، تجميع النتائج حول كيفية تأثير مكونات EBHD على مقدمي التعليقات، وتسليط الضوء على المشاكل المفتوحة التي يمكن أن تكون اتجاهات بحثية في المستقبل.
نحن نحلل 6.7 مليون وثائق قانون القضية لتحديد وجود التحيز بين الجنسين في نظامنا القضائي. نجد أن طرق كشف التحيز الحالية في NLP غير كافية لتحديد التحيز بين الجنسين في قاعدة بيانات القوانين الخاصة بنا واقتراح نهج بديل. نظهر أن النتائج غير المتسقة للخوارز ميات الحالية هي عواقب التعريفات غير المتسقة للبحث المسبق للاحماء أنفسهم. تعتمد خوارزميات الكشف عن التحيز على مجموعات من الكلمات لتمثيل التحيز (على سبيل المثال، الراتب، "الوظيفة"، بوس "لتمثيل التوظيف كموضوع متحيز يحتمل على المرأة في نص). ومع ذلك، فإن الطرق التي تبني هذه المجموعات من الكلمات لها عدة نقاط ضعف، في المقام الأول أن قوائم الكلمات تستند إلى حدس الباحثين الخاصة. نقترح طريقتين جديدتين لأتمتة إنشاء قوائم الكلمات لتمثيل التحيزات. نجد أن طرقنا تتفوق على طرق الكشف عن التحيز الحالية NLP الحالية. يحسن أبحاثنا إمكانات تقنية NLP للكشف عن التحيز وتسلط الضوء على التحيزات الجنسانية الموجودة في قانون الحالة المؤثرة. من أجل اختبار أداء طريقة الكشف عن التحيز NLP، نتراجع نتائج التحيز لدينا في حالة القانون ضد بيانات تعداد الولايات المتحدة من مشاركة المرأة في القوى العاملة في المائة عام الماضية.
من المفترض أن يتحدث Chatbots المجال المفتوح بحرية مع البشر دون أن يقتصر على موضوع أو مهمة أو مجال. ومع ذلك، فإن حدود و / أو محتويات المحادثات المفتوحة ليست واضحة. لتوضيح حدود الانفتاح "، نقوم بإجراء دراستين: أولا، نقوم بتصنيف أنواع أحداث الكلام" واجه تها في مجموعة بيانات تقييم ChatBot (أي مينا من Google) وتجد أن هذه المحادثات تغطي بشكل أساسي الكلام الصغير بشكل أساسي "الفئة واستبعاد وفئات أحداث الكلام الأخرى التي تواجهها في الحياة البشرية الحقيقية البشرية. ثانيا، نقوم بإجراء دراسة تجريبية صغيرة على نطاق واسع لتوليد محادثات عبر الإنترنت تغطي مجموعة واسعة من فئات أحداث الكلام بين إطارين مقابل رجل بشري وحديث من شاتبوت (I.E.، خلاط على Facebook). يشير التقييم البشري لهذه المحادثات الناتجة إلى تفضيل للمحادثات البشرية، لأن محادثات الإنسان التي تشاتبوت تفتقر إلى التماسك في معظم فئات أحداث الكلام. بناء على هذه النتائج، نقترح (أ) استخدام مصطلح الحديث الصغير "بدلا من المجال المفتوح" للاتحاد الحالي الذي لا يفتح "من حيث قدرات المحادثة بعد، و (ب) مراجعة أساليب التقييم لاختبار محادثات Chatbot ضد أحداث الكلام الأخرى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا