ترغب بنشر مسار تعليمي؟ اضغط هنا

يستخدم تعليم التمثيل على نطاق واسع في NLP لمجموعة واسعة من المهام.ومع ذلك، غالبا ما تعكس التمثيلات المستمدة من Text Corpora التحيزات الاجتماعية.هذه الظاهرة منتشرة ومتسقة عبر نماذج عصبية مختلفة، مما تسبب في قلق شديد.تعتمد الأساليب السابقة في الغالب عل ى اتجاه محدد مسبقا أو مقدم من المستخدم أو يعاني من التدريب غير المستقر.في هذه الورقة، نقترح نموذجا للدوائر المنفذة من الخصومة إلى Decouple Decouple Socied Socials من التمثيلات المتوسطة المدربة على المهمة الرئيسية.نحن نهدف إلى Denoise معلومات التحيز أثناء التدريب على مهمة المصب، بدلا من إزالة التحيز الاجتماعي ومتابعة التمثيلات غير المتحيزة الثابتة.تظهر التجارب فعالية طريقتنا، سواء على تأثير الدخل وأداء المهمة الرئيسية.
إن استخدام CrowDWorkers في بحث NLP ينمو بسرعة، جنبا إلى جنب مع الزيادة الأسية في الإنتاج البحثي في ​​التعلم الآلي و AI. عادة ما يقتصر المناقشة الأخلاقية المتعلقة باستخدام الجمهور في مجتمع أبحاث NLP في نطاق القضايا المتعلقة بظروف العمل مثل الأجر العاد ل. نلفت الانتباه إلى عدم وجود اعتبارات أخلاقية تتعلق بالمهام المختلفة التي يقوم بها العمال، بما في ذلك وضع العلامات والتقييم والإنتاج. نجد أن القاعدة النهائية، والإطار الأخلاقي المشترك الذي يستخدمه الباحثون، لم يتوقع استخدام منصات التعهيد الجماعي عبر الإنترنت لجمع البيانات، مما أدى إلى فجوات بين روح وممارسة أخلاقيات الأشخاص البشري في أبحاث NLP. نحن تعدد السيناريوهات الشائعة التي يكون فيها crowdworkers التي يقومون بها مهام NLP معرضة لخطر الأذى. وبالتالي نوصي الباحثون بتقييم هذه المخاطر من خلال النظر في المبادئ الأخلاقية الثلاثة التي أنشأها تقرير بلمونت. ونوضح أيضا بعض المفاهيم الخاطئة المشتركة فيما يتعلق بتطبيق مجلس المراجعة المؤسسية (IRB). نأمل أن تعمل هذه الورقة على إعادة فتح المناقشة داخل مجتمعنا فيما يتعلق بالاستخدام الأخلاقي للجمهور.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا