المهمة Sereval 2021 Semeval 5: الكشف عن الأمور السامة هي مهمة تحديد المواقف المسيح السامة في النص، والتي توفر أداة أوتوماتيكية قيمة للمحتويات عبر الإنترنت المعتدلة.هذه الورقة تمثل طريقة المركز الثاني للمهمة، وفريق مناهضين.في حين يعتمد نهج واحد على الجمع بين أساليب التضمين المختلفة لاستخراج التمثيلات الدلالية والمنظمات المختلفة للكلمات في السياق؛يستخدم الآخر بيانات إضافية مع التدريب الذاتي المخصص قليلا، وهي تقنية تعليمية شبه إشراف، لمشاكل علامات التسلسل.يستفيد كل من بهيئاتنا نموذجا قويا لغة قوية، والتي تم ضبطها بشكل جيد على مهمة تصنيف سامة.على الرغم من أن الأدلة التجريبية تشير إلى فعالية أعلى من النهج الأول من المرتبة الثانية، فإن الجمع بينها يؤدي إلى أفضل النتائج لدينا من 70.77 F1 النتيجة على اختبار DataSet.
The SemEval 2021 task 5: Toxic Spans Detection is a task of identifying considered-toxic spans in text, which provides a valuable, automatic tool for moderating online contents. This paper represents the second-place method for the task, an ensemble of two approaches. While one approach relies on combining different embedding methods to extract diverse semantic and syntactic representations of words in context; the other utilizes extra data with a slightly customized Self-training, a semi-supervised learning technique, for sequence tagging problems. Both of our architectures take advantage of a strong language model, which was fine-tuned on a toxic classification task. Although experimental evidence indicates higher effectiveness of the first approach than the second one, combining them leads to our best results of 70.77 F1-score on the test dataset.
المراجع المستخدمة
https://aclanthology.org/
نستفيد من BLSTM مع الاهتمام لتحديد المواقف السامة في النصوص.نستكشف أبعاد مختلفة تؤثر على أداء النموذج.البعد الأول الذي تم استكشافه هو المجموعة السامة يتم تدريب النموذج.إلى جانب مجموعة البيانات المقدمة، نستكشف قدرة تحويل 5 مجموعات ذات صلة سامة مختلفة،
غالبا ما تكون اللغة السامة موجودة في المنتديات عبر الإنترنت، خاصة عندما تنشأ السياسة وغيرها من الموضوعات الاستقطابية، ويمكن أن تؤدي إلى أن يصبحوا محبطين من الانضمام إلى المحادثات أو الاستمرار فيها.في هذه الورقة، نستخدم البيانات التي تتألف من تعليقات
تقدم هذه الورقة التقديم الخاص بنا إلى مهمة Semeval-2021 5: الكشف عن الأمور السامة.الغرض من هذه المهمة هو اكتشاف المواقف التي تجعل النص ساما، وهو عمل معقد لعدة أسباب.أولا، بسبب الذاتية الجوهرية للسمية، وثانيا، بسبب السمية لا تأتي دائما من كلمات مفردة
نقدم شبكتين نفعي نفعي للتنبؤ بتعقيد الكلمات والعبارات في السياق على نطاق مستمر.كلا النموذجين يستخدم كلا الكلمة والشخصيات إلى جانب ميزات معجمية كمدخلات.يعرض نظامنا نتائج معقولة مع ارتباط بيرسون من 0.7754 في المهمة ككل.نحن نسلط الضوء على قيود هذه الطري
تتطلب مهمة الكشف عن المسافة السامة في Semeval-2021 المشاركين الذين يتعين على المشاركين التنبؤ بالوظائف السامة التي كانت مسؤولة عن الملصق السام للوظائف.يمكن معالجة المهمة كمصموع تسلسل إشراف، باستخدام بيانات التدريب مع يمتد سامة الذهب المقدمة من المنظم