ترغب بنشر مسار تعليمي؟ اضغط هنا

WLV-RIT في Germeval 2021: التعلم المتعدد التعلم مع المحولات للكشف عن تعليقات سامة ومشاركة وحقيقة

WLV-RIT at GermEval 2021: Multitask Learning with Transformers to Detect Toxic, Engaging, and Fact-Claiming Comments

369   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تتناول هذه الورقة تحديد تعليقات سامة ومشاركة وتحقيق الحقائق على وسائل التواصل الاجتماعي.استخدمنا مجموعة البيانات المتاحة من قبل منظمي المهمة المشتركة Germeval2021 التي تحتوي على أكثر من 3000 تعليقات Facebook المزروعة يدويا باللغة الألمانية.بالنظر إلى رابط المهام الثلاث، اتصلنا بالمشكلة باستخدام نماذج محولات محول كبيرة مدربة مسبقا وتعلم التعدد المتعدد.تشير نتائجنا إلى أن التعلم المتعدد يحقق الأداء متفوقا على نهج التعلم المهمة الأكثر شيوعا في المهام الثلاثة.نقدم أفضل أنظمةنا إلى Germeval-2021 تحت اسم الفريق WLV-RIT.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نقدم مساهمة UPAPPLIEDCL في مهمة جيرفال 2021 المشتركة.على وجه الخصوص، شاركنا في SubTasks 2 (تصنيف التعليق التجاري) و 3 (تصنيف التعليق الذي يدعي الحقائق).على الرغم من أن النتائج المقبولة يمكن الحصول عليها باستخدام أجهزة UNIGRAMS أو الميز ات اللغوية بالاشتراك مع نماذج تعلم الآلة التقليدية، فإننا نوضح أنه لكلا نماذج محولات المهام المدربة تدريبا على أشرطة Berted Bertdings التي تحمل أفضل نتائج.
أدى توافر تمثيلات اللغة التي تعلمتها نماذج الشبكة العصبية العصبية الكبيرة (مثل Bert and Electra) إلى تحسينات في العديد من مهام معالجة اللغة الطبيعية المصب في السنوات الأخيرة.تختلف النماذج المحددة عادة في الأهداف المحددة، والبنية، ومجموعات البيانات ال تي تم تدريبها عليها والتي يمكن أن تؤثر على أداء المصب.في هذه المساهمة، نحن نضرب نماذج بيرت الألمانية والألمانية الكترا لتحديد السامة (الفرعية 1)، وجذابة (SubTask 2)، وتعليقات تدعي الحقائق (SubTask 3) في بيانات Facebook المقدمة من مسابقة Germeval 2021.أنشأنا مجموعة من هذه النماذج والتحقيق في ما إذا كان أداء التصنيف يعتمد على عدد أعضاء الفرقة وتكوينهم.على بيانات خارج العينة، حققت أفضل مجموعة لدينا درجة ماكرو F1 من 0.73 (لجميع المهام الفرعية)، وعشرات F1 من 0.72، 0.70، و 0.76 للحصول على المهام الفرعية 1، 2، و 3، على التوالي.
تصف هذه الورقة أساليبنا المقدمة لمهمة Germeval 2021 المشتركة بشأن تحديد تعليقات سمية ومشاركة في الحقائق في نصوص وسائل التواصل الاجتماعي (RISCH et al.، 2021).نستكشف استراتيجيات بسيطة للجيل شبه التلقائي من الأنظمة القائمة على القواعد ذات الدقة عالية وا ستدعاء منخفضة، واستخدامها لتحقيق تحسينات إجمالية طفيفة على تصنيف قياسي مقرها بيرت.
في هذه الورقة، نبلغ عن نهجنا لمعالجة المهمة المشتركة ل Germeval 2021 بشأن تحديد تعليقات سمية ومشاركة وحقائق اللغة الألمانية. لقد قدمنا ​​ثلاثة أشواط لكل فرقة فرعية بناء على مجموعات من ثلاث نماذج تستخدم من حيث أن تضمينات سياقية من نماذج اللغة المدربة مسبقا باستخدام SVM والأصنف في الشبكة العصبية. نحن ندرج نماذج اللغة اللغوية واللغة - مثل اللغة المعزنة - سواء مع وبدون ضبط جيد. نلاحظ أنه بالنسبة للتشغيل الذي قمنا بإرسال نماذج SVM إلى البيانات التدريبية وتأثر ذلك على طريقة التجميع (التصويت بالأغلبية البسيطة) من الفرمشط. يسجل النموذج أداء أقل في مجموعة الاختبار من مجموعة التدريب. استكشاف مسألة التجاوز الكشف عنها أنه بسبب وجود خطأ في خط الأنابيب، لم يتم تدريب المدافع الذي قدمناه على المجموعة الكاملة ولكن فقط في مجموعة تدريبية صغيرة. لذلك في هذه الورقة، نضمن أيضا النتائج التي نحصل عليها عند تدريبها على مجموعة التدريب الكامل والتي تثبت قوة الفرمز.
نقدم Germeval 2021 المهمة المشتركة بشأن تحديد تعليقات السامة والإخراجية والحقائق. تضم هذه المهمة المشتركة ثلاث مجموعات فرعية تصنيف ثنائية بهدف تحديد: تعليقات سامة، وإشراك التعليقات، والتعليقات التي تشمل مؤشرات على الحاجة إلى فحص الحقائق، يشار إليها ه نا كتعليقات مطالبة بالحقائق. بناء على المهام المشتركة السابقة للجراثيم السابقة بشأن تحديد اللغة الهجومية في عامي 2018 و 2019، نقوم بتوسيع تعريف المهمة لهذا العام لتلبية طلب المشرفين ومديري المجتمع على إبراز التعليقات التي تعزز التواصل المحدد، وتشجيع المناقشات المتعمقة، وتشجيع المناقشات المتعمقة، و تحقق من الحقائق التي تعتمد خطوط الحجج. تشتمل مجموعة البيانات على 4،188 وظيفة مستخرجة من صفحة الفيسبوك لمظهر حديث سياسي ألماني من مذيع تلفزيوني عام وطني. الإطار النظري واختبارات الموثوقية الإضافية خلال عملية شروح البيانات ضمان جودة البيانات عالية بشكل خاص. كانت المهمة المشتركة 15 فريقا مشاركا تقدم 31 أشواط للمشاركة في التعليقات الفرعية بشأن التعليقات السامة، و 25 أشواطا للمتعلقة الفرعية حول إشراك التعليقات، و 31 مقابل الترابط الفرعي على تعليقات المطالبة بالحقائق. يمكن العثور على موقع المهام المشترك في https://germeval2021toxic.github.io/sharedtask/.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا