تحديد التحيزات الاجتماعية في NLP: تعميم ومقارنة تجريبية لمقاييس الإنصاف الخارجي


الملخص بالعربية

تحيز قياس التجريدي هو المفتاح لفهم أفضل ومعالجة الظلم في نماذج NLP / ML.غالبا ما يتم ذلك عبر مقاييس الإنصاف، مما يحدد الاختلافات في سلوك النموذج عبر مجموعة من المجموعات الديموغرافية.في هذا العمل، ألقينا المزيد من الضوء على الاختلافات وتشابه التشابه بين مقاييس الإنصاف المستخدمة في NLP.أولا، نقوم بتوحيد مجموعة واسعة من المقاييس الموجودة بموجب ثلاثة مقاييس المعرفة المعممة، وكشف عن الاتصالات بينهما.بعد ذلك، نقوم بإجراء مقارنة تجريبية واسعة النطاق للمقاييس الموجودة وإظهار أن الاختلافات المرصودة في قياس التحيز يمكن تفسيرها بشكل منهجي عبر الاختلافات في خيارات المعلمات لمقاييسنا المعمم.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث