الجنسية في القضاء: أهمية تعريف التحيز في NLP وفي محاكمنا


الملخص بالعربية

نحن نحلل 6.7 مليون وثائق قانون القضية لتحديد وجود التحيز بين الجنسين في نظامنا القضائي. نجد أن طرق كشف التحيز الحالية في NLP غير كافية لتحديد التحيز بين الجنسين في قاعدة بيانات القوانين الخاصة بنا واقتراح نهج بديل. نظهر أن النتائج غير المتسقة للخوارزميات الحالية هي عواقب التعريفات غير المتسقة للبحث المسبق للاحماء أنفسهم. تعتمد خوارزميات الكشف عن التحيز على مجموعات من الكلمات لتمثيل التحيز (على سبيل المثال، الراتب، "الوظيفة"، بوس "لتمثيل التوظيف كموضوع متحيز يحتمل على المرأة في نص). ومع ذلك، فإن الطرق التي تبني هذه المجموعات من الكلمات لها عدة نقاط ضعف، في المقام الأول أن قوائم الكلمات تستند إلى حدس الباحثين الخاصة. نقترح طريقتين جديدتين لأتمتة إنشاء قوائم الكلمات لتمثيل التحيزات. نجد أن طرقنا تتفوق على طرق الكشف عن التحيز الحالية NLP الحالية. يحسن أبحاثنا إمكانات تقنية NLP للكشف عن التحيز وتسلط الضوء على التحيزات الجنسانية الموجودة في قانون الحالة المؤثرة. من أجل اختبار أداء طريقة الكشف عن التحيز NLP، نتراجع نتائج التحيز لدينا في حالة القانون ضد بيانات تعداد الولايات المتحدة من مشاركة المرأة في القوى العاملة في المائة عام الماضية.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث