ترغب بنشر مسار تعليمي؟ اضغط هنا

Universit \ "في Regensburg Maxs في Germeval 2021 المهمة 1: البيانات الاصطناعية في تصنيف التعليق السام

Universit\"at Regensburg MaxS at GermEval 2021 Task 1: Synthetic Data in Toxic Comment Classification

359   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نبلغ عن تقديمنا إلى المهمة 1 من تحدي جيرفال 2021 - تصنيف التعليق السام.نحقق في طرق مختلفة لتعزيز البيانات التدريبية النادرة لتحسين الأداء النموذجي خارج الرف على مهمة تصنيف سامة للتعليق.للمساعدة في معالجة قيود مجموعة بيانات صغيرة، نستخدم البيانات التي تم إنشاؤها مزخرف بواسطة نموذج GPT-2 الألماني.إن استخدام البيانات الاصطناعية لم تقلع مؤخرا كحل محتمل لبيانات التدريب التدريجي في مجال التصديق في NLP، والنتائج الأولية تعد.ومع ذلك، لم ير نموذجنا تحسنا قياسيا من خلال استخدام البيانات الاصطناعية.نناقش أسباب محتملة لهذا الاكتشاف واستكشاف الأعمال المستقبلية في هذا المجال.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذا العمل، نقدم نهجنا على مهمة تصنيف التعليقات السامة (الفرعية 1) من المهمة المشتركة لجيرفال 2021.لهذه المهمة الثنائية، نقترح ثلاث نماذج: نموذج محول بيرت ألماني؛Perceptron متعدد الطبقات، التي تم تدريبها لأول مرة بالتوازي على الإدخال النصي و 14 ميز ات لغوية إضافية ثم تم تسليمها في طبقة إضافية؛ومثيرة الطبقات متعدد الطبقات مع كل من أنواع الميزات كمدخلات.عززنا النموذج المحول المدرب مسبقا من خلال إعادة تدريبه مع أكثر من مليون تغريدة وصقله على مجموعة بيانات ألمانية إضافية من مهام مماثلة.تم اتخاذ أنظمة بيرت الألمانية النهائية التي تم ضبطها بشكل نهائي كميزات مدخلات نصية لشبكاتنا العصبية.كانت أفضل النماذج الخاصة بنا في بيانات التحقق من الصحة كانت شبكات عصبية، لكن بيرت الألمانية المعززة المكتسبة مع درجة F1 = 0.5895 تنبؤ أعلى في بيانات الاختبار.
تصف هذه الورقة مساهمتنا في مهمة Semeval 2021 1 (Shardlow et al.، 2021): تنبؤ التعقيد المعجمي.في نهجنا، نستفيد النموذج Electra ومحاولة تعكس نظام شرح البيانات.على الرغم من أن المهمة مهمة الانحدار، إلا أننا نوضح أننا نستطيع التعامل معها كجميع العديد من نماذج التصنيف والانحدار.حقق هذا النهج المضاد بشدة إلى حد ما درجة مياه 0.0654 للمهمة الفرعية 1 و MAE من 0.0811 بشأن المهمة الفرعية 2. بالإضافة إلى ذلك، استخدمنا مفهوم إشارات الإشراف الضعيفة من برت لمعان في عملنا، وتحسن بشكل كبيردرجة ماي في المهمة الفرعية 1.
إن تقييم تعقيد كلمة مستهدفة في سياق حكومي هو الهدف من مهمة تنبؤ التعقيد المعجمية في Semeval-2021.تقدم هذه الورقة النظام الذي تم إنشاؤه لتقييم تعقيد كلمات واحدة معجمية، والجمع بين المتغيرات اللغوية والنفسية في مجموعة من التجارب التي تنطوي على غابة عشو ائية و XGBOOST Regrations.ما وراء ترميز معلومات خارج السياق حول LEMMA، نفذنا ميزات بناء على نماذج اللغة المدربة مسبقا لنموذج تعقيد الكلمة المستهدف في السياق.
في هذه الورقة، نحقق في فعالية استخدام المدينات السياقية من بيرت متعددة اللغات، بيرت الألمانية في تحديد تعليقات المطالبة بالحقائق باللغة الألمانية على وسائل التواصل الاجتماعي.بالإضافة إلى ذلك، ندرس تأثير صياغة مشكلة التصنيف كأداة تعليمية متعددة المهام ، حيث يحدد النموذج السمية ومشاركة التعليق بالإضافة إلى تحديد ما إذا كان يدعي الحقيقة.نحن نقدم مقارنة شاملة من النماذج التي تستند إلى بيرت مقارنة بناسي الانحدار اللوجستي وإظهار أن ميزات بيرت الألمانية المدربة باستخدام هدف متعدد المهام يحقق أفضل درجة F1 في مجموعة الاختبار.تم تنفيذ هذا العمل كجزء من تقديم المهمة المشتركة ل Germeval 2021 بشأن تحديد تعليقات المطالبة بالحقائق.
تقدم هذه المقالة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021 5: الكشف السام يمتد.تأتي بيانات هذه المهمة المشتركة من بعض المشاركات على الإنترنت.الهدف المهمة هو تحديد المحتوى السام الوارد في هذه البيانات النصية.نحتاج إلى إيجاد فترة النص السام في البيانات النصية بدقة قدر الإمكان.في نفس المنصب، قد يكون النص السام فقيرا واحدا أو فقرات متعددة.يستخدم فريقنا مخطط التصنيف بناء على مستوى Word لإنجاز هذه المهمة.النظام الذي اعتدنا على تقديم النتائج هو Albert + Bilstm + CRF.مؤشر تقييم النتيجة لتقديم المهمة هو درجة F1، والنتيجة النهائية للنتيجة التنبؤية لمجموعة الاختبار المقدمة من فريقنا هي 0.6640226029.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا