تحيز قياس التجريدي هو المفتاح لفهم أفضل ومعالجة الظلم في نماذج NLP / ML.غالبا ما يتم ذلك عبر مقاييس الإنصاف، مما يحدد الاختلافات في سلوك النموذج عبر مجموعة من المجموعات الديموغرافية.في هذا العمل، ألقينا المزيد من الضوء على الاختلافات وتشابه التشابه بين مقاييس الإنصاف المستخدمة في NLP.أولا، نقوم بتوحيد مجموعة واسعة من المقاييس الموجودة بموجب ثلاثة مقاييس المعرفة المعممة، وكشف عن الاتصالات بينهما.بعد ذلك، نقوم بإجراء مقارنة تجريبية واسعة النطاق للمقاييس الموجودة وإظهار أن الاختلافات المرصودة في قياس التحيز يمكن تفسيرها بشكل منهجي عبر الاختلافات في خيارات المعلمات لمقاييسنا المعمم.
Abstract Measuring bias is key for better understanding and addressing unfairness in NLP/ML models. This is often done via fairness metrics, which quantify the differences in a model's behaviour across a range of demographic groups. In this work, we shed more light on the differences and similarities between the fairness metrics used in NLP. First, we unify a broad range of existing metrics under three generalized fairness metrics, revealing the connections between them. Next, we carry out an extensive empirical comparison of existing metrics and demonstrate that the observed differences in bias measurement can be systematically explained via differences in parameter choices for our generalized metrics.
المراجع المستخدمة
https://aclanthology.org/
نحن نعمل على تعميم فكرة قياس التحيزات الاجتماعية في Word Ageddings لإضاءة Word بصريا. الحياز موجودة في المدينات المتطرفة، ويبدو أنها بالفعل أكثر أهمية أو أكثر أهمية من المدمج غير المقصود. هذا على الرغم من حقيقة أن الرؤية واللغة يمكن أن تعاني من تحيزا
يمكن للبشر تعلم مهمة لغة جديدة بكفاءة مع عدد قليل فقط من الأمثلة، من خلال الاستفادة من معارفهم التي تم الحصول عليها عند تعلم المهام السابقة. في هذه الورقة، نستكشف ما إذا كان يمكن الحصول على قدرة تعميم المهام عبر المهام المباشرة، وتطبيقها بشكل أكبر عل
تعتمد منصات وسائل التواصل الاجتماعي عبر الإنترنت على نحو متزايد على تقنيات معالجة اللغة الطبيعية (NLP) للكشف عن محتوى مسيء على نطاق واسع من أجل تخفيف الأضرار التي يسببها لمستخدميها. ومع ذلك، فإن هذه التقنيات تعاني من مختلف تحيزات أخذ العينات والجمعية
لقد حقق مجال NLP تقدما كبيرا في بناء تعويضات المعنى.ومع ذلك، تم تجاهل جانب مهم من المعنى اللغوي، والمعنى الاجتماعي، إلى حد كبير.نقدم مفهوم المعنى الاجتماعي ل NLP ومناقشة كيفية إبلاغ رؤى Sociolinguics بالعمل على التعلم في التمثيل في NLP.نحدد أيضا التحديات الرئيسية لهذا الخط الجديد من البحث.
نادرا ما تعطي أنظمة NLP اعتبارا خاصا للأرقام الموجودة في النص.هذا يتناقض بشكل صارخ مع توافق الآراء في علم الأعصاب، في الدماغ، يتم تمثيل الأرقام بشكل مختلف عن الكلمات.نحن نقوم بترتيب أعمال NLP الأخيرة على الحساب في تصنيف شامل للتصنيف والأساليب.نقوم بف