ترغب بنشر مسار تعليمي؟ اضغط هنا

S-NLP في مهمة Semeval-2021 5: تحليل الشبكات المزدوجة لعلامات التسلسل

S-NLP at SemEval-2021 Task 5: An Analysis of Dual Networks for Sequence Tagging

241   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المهمة Sereval 2021 Semeval 5: الكشف عن الأمور السامة هي مهمة تحديد المواقف المسيح السامة في النص، والتي توفر أداة أوتوماتيكية قيمة للمحتويات عبر الإنترنت المعتدلة.هذه الورقة تمثل طريقة المركز الثاني للمهمة، وفريق مناهضين.في حين يعتمد نهج واحد على الجمع بين أساليب التضمين المختلفة لاستخراج التمثيلات الدلالية والمنظمات المختلفة للكلمات في السياق؛يستخدم الآخر بيانات إضافية مع التدريب الذاتي المخصص قليلا، وهي تقنية تعليمية شبه إشراف، لمشاكل علامات التسلسل.يستفيد كل من بهيئاتنا نموذجا قويا لغة قوية، والتي تم ضبطها بشكل جيد على مهمة تصنيف سامة.على الرغم من أن الأدلة التجريبية تشير إلى فعالية أعلى من النهج الأول من المرتبة الثانية، فإن الجمع بينها يؤدي إلى أفضل النتائج لدينا من 70.77 F1 النتيجة على اختبار DataSet.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نستفيد من BLSTM مع الاهتمام لتحديد المواقف السامة في النصوص.نستكشف أبعاد مختلفة تؤثر على أداء النموذج.البعد الأول الذي تم استكشافه هو المجموعة السامة يتم تدريب النموذج.إلى جانب مجموعة البيانات المقدمة، نستكشف قدرة تحويل 5 مجموعات ذات صلة سامة مختلفة، بما في ذلك مجموعات الهجومية والسامة والمسيئة والكراهية.نجد أن المجموعة المسيئة فقط تظهر أعلى وعد القدرة على التحويل.البعد الثاني الذي نستكشفه هو المنهجية، بما في ذلك الاستفادة من الاهتمام، وتوظيف طريقة إزالة الجشع، باستخدام نسبة التردد، وفحص المجموعات الهجينة من طرق متعددة.نقوم بإجراء تحليل خطأ لفحص أنواع الأيوب السامة التي تم تفويتها والتي تم استنتاجها بشكل خاطئ على أنها سامة مع الأسباب الرئيسية وراء حدوثها.أخيرا، نقوم بتوسيع نطاق أسلوبنا عبر الفرع، والذي يحقق أعلى درجة F1 لدينا من 55.1.
غالبا ما تكون اللغة السامة موجودة في المنتديات عبر الإنترنت، خاصة عندما تنشأ السياسة وغيرها من الموضوعات الاستقطابية، ويمكن أن تؤدي إلى أن يصبحوا محبطين من الانضمام إلى المحادثات أو الاستمرار فيها.في هذه الورقة، نستخدم البيانات التي تتألف من تعليقات مع مؤشرات النص السام المسمى لتدريب RNN لردع الألغام التي تجعلها أجزاء من التعليقات تجعلها سامة، والتي يمكن أن تساعد المشرفين عبر الإنترنت.نقارن النتائج باستخدام مجموعة البيانات الأصلية ومجموعة معدات، وكذلك نماذج Gru مقابل LSTM RNN.
تقدم هذه الورقة التقديم الخاص بنا إلى مهمة Semeval-2021 5: الكشف عن الأمور السامة.الغرض من هذه المهمة هو اكتشاف المواقف التي تجعل النص ساما، وهو عمل معقد لعدة أسباب.أولا، بسبب الذاتية الجوهرية للسمية، وثانيا، بسبب السمية لا تأتي دائما من كلمات مفردة مثل الإهانات أو التمثيل، ولكن في بعض الأحيان من التعبيرات بأكملها تشكلت بكلمات قد لا تكون سامة بشكل فردي.بعد هذه الفكرة التركيز على كل من الكلمات المفردة وتعبيرات متعددة الكلمة، ندرس تأثير استخدام نموذج مستعمل متعدد العميم، والذي يستخدم embeddings من طبقات مختلفة لتقدير السمية النهائية لكل رمزية.تظهر النتائج الكمية لدينا أن استخدام المعلومات من أعماق متعددة يعزز أداء النموذج.أخيرا، نقوم أيضا بتحليل أفضل نموذج لدينا نوعيا.
نقدم شبكتين نفعي نفعي للتنبؤ بتعقيد الكلمات والعبارات في السياق على نطاق مستمر.كلا النموذجين يستخدم كلا الكلمة والشخصيات إلى جانب ميزات معجمية كمدخلات.يعرض نظامنا نتائج معقولة مع ارتباط بيرسون من 0.7754 في المهمة ككل.نحن نسلط الضوء على قيود هذه الطري قة في تقييم سياق النص المستهدف بشكل صحيح، واستكشاف فعالية كل من النظم عبر مجموعة من الأنواع.تم تقديم كلا النموذجين كجزء من LCP 2021، والذي يركز على تحديد الكلمات والعبارات المعقدة باعتبارها مهمة تعتمد على السياق، وهي مهمة قائمة على الانحدار.
تتطلب مهمة الكشف عن المسافة السامة في Semeval-2021 المشاركين الذين يتعين على المشاركين التنبؤ بالوظائف السامة التي كانت مسؤولة عن الملصق السام للوظائف.يمكن معالجة المهمة كمصموع تسلسل إشراف، باستخدام بيانات التدريب مع يمتد سامة الذهب المقدمة من المنظم ين.يمكن التعامل معها أيضا على أنها استخراج الأساس المنطقي، باستخدام مصنفات مدربين على مجموعات بيانات خارجية أكبر من الوظائف المشروحة يدويا على أنها سامة أم لا، دون شروح سامةبالنسبة لنهج وضع التسلسل الإشرافي وأغراض التقييم، كانت الوظائف التي سبق وصفها بأنها سامة مشروحة من أشكال الجماهير السامة.قدم المشاركون يمتدين المتوقعين من أجل مجموعة اختبار محمولة وسجلوا باستخدام F1 القائمة على الطابع.يلخص النظرة نظرة عامة عمل الفرق 36 التي قدمت أوصاف النظام.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا