ترغب بنشر مسار تعليمي؟ اضغط هنا

التخفيف من التحيزات في الكشف عن اللغة السامة من خلال الترشيد الثابت

Mitigating Biases in Toxic Language Detection through Invariant Rationalization

273   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يلعب الكشف التلقائي باللغة السامة دورا أساسيا في حماية مستخدمي الوسائط الاجتماعية، وخاصة مجموعات الأقليات، من الإساءة اللفظية.ومع ذلك، فإن التحيزات تجاه بعض الصفات، بما في ذلك النوع الاجتماعي والعرق واللهجة، موجودة في معظم مجموعات البيانات التدريبية للكشف عن السمية.تحيزات تجعل النماذج المستفادة غير عادلة ويمكن أن تؤدي إلى تفاقم تهميش الناس.بالنظر إلى أن طرق الدخل الحالية لمهام فهم اللغة الطبيعية العامة لا يمكن أن تخفف بشكل فعال من التحيزات في كاشفات السمية، نقترح استخدام الترشيد الثابت (invrat)، وهو إطار نظري للعبة يتكون من مولد الأساس المنطقي والتوقع، لاستبعاد الزائفةالارتباط ببعض الأنماط النحوية (على سبيل المثال، يذكر الهوية، لهجة) إلى تسميات السمية.نظرا لإيذاء أن طريقتنا تنتج معدل إيجابي كاذب أقل في كل من الصفات المعجمية واللهائية من أساليب الدخل السابقة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لا تزال التحيزات منتشرة في النصوص والإعلام الحديث، وخاصة التحيز الذاتي - نوع خاص من التحيز الذي يقدم مواقف غير لائقة أو يقدم بيان مع افتراض الحقيقة. لمعالجة مشكلة الكشف عن التحيز الذاتي والتخفيف، نقدم كوربايا موازية مشروح يدويا مع أكثر من 4000 زوجا م ن التعديلات في ويكيبيديا. تحتوي هذه الجوربوس على شروح تجاه كل من أنواع التحيز على مستوى الجملة وشرائح منحازة على مستوى الرمز المميز. نقدم تحليلات منهجية لمجموعة بياناتنا والنتائج التي حققتها مجموعة من خطوط الأساس الحديثة من حيث ثلاث مهام: تصنيف التحيز، ووضع علامات شرائح منحازة، وتحييد النص المتحيز. نجد أن النماذج الحالية لا تزال تكافح مع اكتشاف التحيزات متعددة الأجزاء على الرغم من أدائها المعقول، مما يشير إلى أن DataSet لدينا يمكن أن تكون بمثابة معيار بحث مفيد. نوضح أيضا أن النماذج المدربة على DataSet الخاصة بنا يمكن أن تعزز جيدا إلى مجالات متعددة مثل الأخبار والخطب السياسية.
مع النمو السريع في التكنولوجيا، شهد نشاط وسائل التواصل الاجتماعي طفرة في جميع الفئات العمرية.من المستحيل الإنساني التحقق من جميع التغريدات والتعليقات والحالة يدويا ما إذا كانت تتبع إرشادات المجتمع المناسبة.يتم نشر الكثير من السمية بانتظام على منصات و سائل التواصل الاجتماعي هذه.يهدف هذا البحث إلى إيجاد كلمات سامة في جملة بحيث يتم بناء مجتمع اجتماعي صحي في جميع أنحاء العالم ويتلقى المستخدمون محتوى مراقم مع تحذيرات وحقائق محددة.لحل هذه المشكلة الصعبة، جمع المؤلفون مفاهيم القائمة المرتبطة بمعالجة ما قبل المعالجة ثم استخدمت فكرة المدينات المكدسة مثل Adffeddings Bertdings و Argeddings Flair و Word2VEC على إطار Flairnlp للحصول على النتائج المرجوة.تم استخدام F1 متري لتقييم النموذج.تمكن المؤلفون من إنتاج درجة 0.74 F1 في مجموعة الاختبار الخاصة بهم.
تستكشف هذه الورقة ثلاثة تقنيات معالجة البيانات البسيطة (التوليف، التعزيز، المناهج الدراسية) لتحسين نماذج تلخيص الجماعة دون الحاجة إلى أي بيانات إضافية.نقدم طريقة تخليق البيانات مع إعادة الصياغة، وهي تقنية تكبير البيانات مع خلط العينات، وتعلم المناهج الدراسية مع اثنين من مقاييس صعوبة جديدة بناء على الخصوصية والتغاضي.نقوم بإجراء تجارب لإظهار أن هذه التقنيات الثلاث يمكن أن تساعد في تحسين تلخيص الجماعي عبر نماذج تلخيص واثنين من مجموعات بيانات صغيرة مختلفة.علاوة على ذلك، نعرض أن هذه التقنيات يمكن أن تحسن الأداء عند تطبيقها بمعزل وعند دمجها.
نحن نعمل على تعميم فكرة قياس التحيزات الاجتماعية في Word Ageddings لإضاءة Word بصريا. الحياز موجودة في المدينات المتطرفة، ويبدو أنها بالفعل أكثر أهمية أو أكثر أهمية من المدمج غير المقصود. هذا على الرغم من حقيقة أن الرؤية واللغة يمكن أن تعاني من تحيزا ت مختلفة، والذي قد يأمل المرء أن يخفف من التحيزات في كليهما. توجد طرق متعددة لتعميم التحيز القياسي القياسي في Word Ageddings لهذا الإعداد الجديد. نقدم مساحة التعميمات (Weat-Weat-Weat and Grounded) وإظهار أن ثلاث تعميمات تجيب على أسئلة مختلفة لكنها مهمة حول كيفية تفاعل التحيزات واللغة والرؤية. يتم استخدام هذه المقاييس في مجموعة بيانات جديدة، الأول من أجل التحيز الأساسي، الذي تم إنشاؤه عن طريق زيادة معايير التحيز اللغوي القياسي مع 10228 صورة من كوكو، والتسمية التوضيحية المفاهيمية، وصور جوجل. بناء البيانات يتحدى لأن مجموعات بيانات الرؤية هي نفسها منحازة للغاية. سيبدأ وجود هذه التحيزات في الأنظمة في الحصول على عواقب عالمية حقيقية حيث يتم نشرها، مما يجعلها تقيس التحيز بعناية ثم تخفيفها بالغ الأهمية لبناء مجتمع عادل.
مع توفر المعلومات الرقمية المتزايدة بشكل متزايد، فإن المحتوى السام هو أيضا في ارتفاع. لذلك، فإن اكتشاف هذا النوع من اللغة له أهمية قصوى. نتعامل مع هذه المشكلة باستخدام مجموعة من نموذج اللغة المدربة مسبقا من أحدث (ManalBert) وتقنية حقيبة من الكلمات ال تقليدية. نظرا لأن المحتوى مليء بالكلمات السامة التي لم تتم كتابتها وفقا لإملاء القاموس، فإن الحضور للشخصيات الفردية أمر بالغ الأهمية. لذلك، نستخدم ManalBerT لاستخراج الميزات بناء على أحرف كلمة. يتكون من وحدة LiftCNN التي تتعلم تضمين الأحرف من السياق. هذه هي، إذن، تغذيها بنية بيرت المعروفة. طريقة حقيبة الكلمات، من ناحية أخرى، تتحسن كذلك على ذلك بالتأكد من أن بعض الكلمات السامة المستخدمة في كثير من الأحيان تسمى وفقا لذلك. مع اختلاف ~4 في المئة من الفريق الأول، احتل نظامنا المرتبة 36 في المسابقة. يتوفر الكود لمزيد من البحث واستكمال النتائج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا