ترغب بنشر مسار تعليمي؟ اضغط هنا

Macech في Semeval-2021 المهمة 5: تم تكشف المسام

macech at SemEval-2021 Task 5: Toxic Spans Detection

274   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

غالبا ما تكون اللغة السامة موجودة في المنتديات عبر الإنترنت، خاصة عندما تنشأ السياسة وغيرها من الموضوعات الاستقطابية، ويمكن أن تؤدي إلى أن يصبحوا محبطين من الانضمام إلى المحادثات أو الاستمرار فيها.في هذه الورقة، نستخدم البيانات التي تتألف من تعليقات مع مؤشرات النص السام المسمى لتدريب RNN لردع الألغام التي تجعلها أجزاء من التعليقات تجعلها سامة، والتي يمكن أن تساعد المشرفين عبر الإنترنت.نقارن النتائج باستخدام مجموعة البيانات الأصلية ومجموعة معدات، وكذلك نماذج Gru مقابل LSTM RNN.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تتطلب مهمة الكشف عن المسافة السامة في Semeval-2021 المشاركين الذين يتعين على المشاركين التنبؤ بالوظائف السامة التي كانت مسؤولة عن الملصق السام للوظائف.يمكن معالجة المهمة كمصموع تسلسل إشراف، باستخدام بيانات التدريب مع يمتد سامة الذهب المقدمة من المنظم ين.يمكن التعامل معها أيضا على أنها استخراج الأساس المنطقي، باستخدام مصنفات مدربين على مجموعات بيانات خارجية أكبر من الوظائف المشروحة يدويا على أنها سامة أم لا، دون شروح سامةبالنسبة لنهج وضع التسلسل الإشرافي وأغراض التقييم، كانت الوظائف التي سبق وصفها بأنها سامة مشروحة من أشكال الجماهير السامة.قدم المشاركون يمتدين المتوقعين من أجل مجموعة اختبار محمولة وسجلوا باستخدام F1 القائمة على الطابع.يلخص النظرة نظرة عامة عمل الفرق 36 التي قدمت أوصاف النظام.
تصف هذه الورقة مشاركة فريق سيناء في المهمة 5: الكشف عن الأمور السامة التي تتكون من تحديد المواقف التي تجعل النص سام.على الرغم من أن العديد من الموارد والأنظمة قد تم تطويرها حتى الآن في سياق اللغة الهجومية، ركزت كل من التوضيحية والمهام بشكل رئيسي على تصنيف ما إذا كان النص مسيء أم لا.ومع ذلك، فإن اكتشاف المواقف السامة أمر بالغ الأهمية لتحديد سبب وجود نص سام ويمكنه مساعدة المشرفين البشري لتحديد موقع هذا النوع من المحتوى على وسائل التواصل الاجتماعي.من أجل إنجاز المهمة، نتبع نهجا عميقا قائم على التعلم باستخدام متغير ثنائي الاتجاه لشبكة ذاكرة طويلة الأجل طويلة إلى جانب طبقة فكري حقل عشوائية مشروطة (Bilstm-CRF).على وجه التحديد، نختبر أداء مزيج من مختلف تضمين الكلمة المدربة مسبقا للتعرف على الكيانات السامة في النص.تظهر النتائج أن مزيج من Adgeddings يساعد في اكتشاف المحتوى الهجومي.يرتب فريقنا 29 من أصل 91 مشاركا.
تقدم هذه الورقة نظام يستخدم لمهمة Semeval-2021 5: الكشف عن المسافة السامة.نظامنا هو مجموعة من النماذج القائمة على بيرت لتصنيف الكلمة الثنائية، مدربة على مجموعة بيانات تمتد بواسطة التعليقات السامة المعدلة وتولدها نماذج لغتين.بالنسبة لتصنيف الكلمة السا مة، تم تحسين قيمة عتبة التنبؤ بشكل منفصل لكل تعليق، من أجل زيادة قيمة F1 المتوقعة.
اكتشاف أجزاء من الجملة المساهمة في سمية الجملة - - بدلا من توفير حكم على مستوى الجملة من البهمة --- من شأنه أن يزيد من تفسير النماذج والسماح للمشرفين البشري بفهم نواتج النظام بشكل أفضل.تقدم هذه الورقة فريقنا، UTNLP، منهجية ونتائج المهمة المشتركة SEME VAL-2021 5 على الكشف عن الأمور السامة.نقوم باختبار نماذج متعددة وإدارات سياقية وأبلغ عن أفضل الإعداد من الجميع.تبدأ التجارب بنماذج قائمة على الكلمات الرئيسية ويتبعها نماذج القائم على الكيانات المستندة إلى الكيانات المستندة إلى مجال الانتباه، والتي تستند إلى الكيانات المستندة إلى الكيان ومقرها المحولات.أفضل نهجنا، نموذج الفرقة، يحقق F1 من 0.684 في مرحلة تقييم المسابقة.
اكتشاف المواقف السامة - اكتشاف سمية المحتويات في حبيبتي الرموز - أمر حاسم للاعتدال الفعال للمناقشات عبر الإنترنت.تتمثل النهج الأساسي في هذه المشكلة في استخدام نموذج المحول في إضافة رأس تصنيف رمزي إلى طراز اللغة وضبط الطبقات الدقيقة مع مجموعة بيانات ا لمسمى الرمز المميز.واحدة من قيود مثل هذا النهج الأساسي هي ندرة البيانات المسمى.لتحسين النتائج، درسنا الاستفادة من مجموعات البيانات العامة الحالية للحصول على مهمة ذات صلة ولكن مختلفة بتصنيف التعليق / الجملة بأكملها.نقترح مقارنتين: النهج الأول نماذج محول بخامة مدربة مسبقا في عينات تصنيف الجملة.في النهج الثاني، نقوم بإجراء إشراف ضعيف مع الاهتمام اللين لتعلم تسميات مستوى الرموز من ملصقات الجملة.تجاربنا تظهر التحسينات في درجة F1 عبر النهج الأساسي.تم إصدار التنفيذ علنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا