ترغب بنشر مسار تعليمي؟ اضغط هنا

تقلص نهج التحيز مع اعتماد النماذج على ميزات البيانات الحساسة للبيانات، مثل رموز المجموعة الاجتماعية (SGTS)، مما يؤدي إلى تنبؤات متساوية عبر الميزات الحساسة.ومع ذلك، في الكشف عن الكلام الكراهية، قد يتجاهل تكالير التعادل النموذجي الاختلافات المهمة بين الفئات الاجتماعية المستهدفة، حيث يمكن أن يحتوي خطاب الكراهية على لغة نمطية محددة لكل رقاقة.هنا، لاتخاذ لغة محددة حول كل رقص في الاعتبار، نعتمد على الإنصاف المتعارض واستكمال التنبؤات فيما بينها، ولدت من خلال تغيير SGTS.تقوم طريقتنا بتقييم التشابه في احتمالية الجملة (عبر نماذج اللغة المدربة مسبقا) بين الوسائل المتعددة، لعلاج SGTS على قدم المساواة إلا في سياقات قابلة للتبديل.من خلال تطبيق اقتران Logit لتحقيق التوازن في المجموعة المحظورة من مواجهة المصنع لكل حالة، فإننا نحسن مقاييس الإنصاف مع الحفاظ على الأداء النموذجي في اكتشاف خطاب الكراهية.
تعتبر الأمل مهمة بالنسبة لرفاهية الحياة البشرية واستعادتها من قبل المهنيين الصحيين.يعكس خطاب الأمل الاعتقاد بأن المرء يمكنه اكتشاف مسارات لأهدافها المرجوة وتصبح طرحا للاستفادة من هذه المسارات.لتشجيع البحث في معالجة اللغة الطبيعية نحو نهج التعزيز الإي جابي، أنشأنا مجموعة بيانات الكشف عن الكلام الأمل.هذه التقارير الورقية عن المهمة المشتركة الخاصة باكتشاف الكلام للأمل للتاميل والإنجليزية واللغات المالايالامية.أجريت المهمة المشتركة كجزء من ورشة عمل EACL 2021 حول تكنولوجيا اللغة للمساواة والتنوع والإدماج (LT-EDI-2021).نحن تلخص هنا مجموعات البيانات الخاصة بهذا التحدي المتوفرة بصراحة في https://competitions.codalab.org/competitions/27653، وتقديم نظرة عامة على الأساليب ونتائج النظم المنافسة.إلى حد ما من معرفتنا، هذه هي المهمة المشتركة الأولى لإجراء الكشف عن الكلام الأمل.
في هذه الورقة، نصف التجارب المصممة لتقييم تأثير الميزات المصنوعة من النسيج والعاطفة على الكشف عن الكلام الكراهية: مهمة تصنيف المحتوى النصي في فئات الكلام الكراهية أو غير الكراهية. تجري تجاربنا لمدة ثلاث لغات - اللغة الإنجليزية والسلوفين والهولندية - سواء في النطاق داخل المجال والمجازات، وتهدف إلى التحقيق في خطاب الكراهية باستخدام ميزات النموذجتين الظواهر اللغوية: أسلوب كتابة محتوى الوسائط الاجتماعية البغيضة تعمل كمستخدم Word كدالة على يد واحدة، وتعبير العاطفة في الرسائل البغيضة من ناحية أخرى. نتائج التجارب التي تحتوي على ميزات نموذج مجموعات مختلفة من هذه الظواهر تدعم فرضيتنا أن الميزات الأسيزية والعاطفية هي مؤشرات قوية لخطاب الكراهية. تظل مساهمتها مستمرة فيما يتعلق باختلاف المجال واللغة. نظظ أن مزيج من الميزات التي تتفوقت الظواهر المستهدفة على الكلمات والشخصيات N-Gram الميزات بموجب ظروف عبر المجال، وتوفر دفعة كبيرة لنماذج التعلم العميق، والتي تحصل حاليا على أفضل النتائج، عند دمجها في مجموعة واحدة وبعد
نحن نصف نظامنا الذي تم تصنيفه في المرتبة الأولى في مهمة الكشف عن الكلام في الأمل (HSD) ورابعا في مهمة تشارك في الهجوم (OLI)، سواء في لغة التاميل.الهدف من HSD و OLI هو تحديد ما إذا كان تعليق أو منشور مختلط من التعليمات البرمجية يحتوي على خطاب نأمل أو محتوى مسيحي على التوالي.نقوم مسبقا بتدريب نموذج روبرتا المستندة إلى المحولات باستخدام البيانات المختلطة التي تم إنشاؤها بشكل عام واستخدامها في مجموعة جنبا إلى جنب مع نموذج Ulmfit المدرب مسبقا متاحا من Inltk.
تقدم هذه الورقة بشكل أساسي المحتوى ذي الصلة للكشف عن خطاب الأمل للمهمة للمساواة والتنوع والإدراج في LT-EDI 2021-EACL 2021 ''.تم توفير ما مجموعه ثلاث مجموعات بيانات لغوية، ونختار مجموعة البيانات الإنجليزية لإكمال هذه المهمة.الهدف المهمة المحددة هو تصن يف الكلام المحدد إلى خطاب الأمل "، وليس الكلام الأمل"، وليس في اللغة المقصودة ".فيما يتعلق بالطريقة، نستخدم Albert Tuned و K Fold Validation لإنجاز هذه المهمة.في النهاية، حققنا نتيجة جيدة في قائمة رتبة النتيجة المهمة، وكانت النتيجة F1 النهائية 0.93، ربط للمكان الأول.ومع ذلك، سوف نستمر في محاولة تحسين الأساليب للحصول على نتائج أفضل في العمل في المستقبل.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا