ترغب بنشر مسار تعليمي؟ اضغط هنا

Sarcasmdet في Semeval-2021 المهمة 7: اكتشاف الفكاهة والهجوم على أساس العوامل الديموغرافية باستخدام نموذج روبرتا المدرب مسبقا

SarcasmDet at SemEval-2021 Task 7: Detect Humor and Offensive based on Demographic Factors using RoBERTa Pre-trained Model

288   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة أحد أنظمة المحلول الفائزة الأعلى للمهمة 7 في Semeval2021، Hahackathon: الكشف عن الفكاهة والعموم. تنقسم هذه المسابقة إلى مهام اثنين، Task1 مع ثلاث مهام فرعية 1A، 1B، و 1C، و TASK2. الهدف من المهمة 1 هو التنبؤ إذا كان النص يعتبر روح الدعابة أم لا، وإذا كان الأمر نعم، فقم بالتنبؤ بمكام روح الدعابة وما إذا كان التصنيف فكاهة سيكون مثيرا للجدل. الهدف من المهمة 2 هو التنبؤ بكيفية اعتبار النص مسيئا للمستخدمين بشكل عام. تم تطوير حلنا باستخدام نموذج روبرتا المدرب مسبقا مع تقنيات الفرقة. تصف الورقة بنية نظام الحل المقدم مع التجارب وضبط فرط الضغط الذي أدى إلى هذا النظام القوي. في المرتبة النموذجية المرتبة الثالثة والرابعة من 50 فريقا في المهام 1C و 1A مع درجة F1 0.6270 و 0.9675 على التوالي. في الوقت نفسه، احتل النموذج واحدا من أفضل 10 نماذج في المهمة 1B والمهمة 2 مع درجات RMSE من 0.5446 و 0.4469 على التوالي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم هذه المقالة تقديم الفرعية 1 و SubTask 2 الذي نشارك فيه في مهمة Semeval-2021 7: Hahackathon: الكشف عن الفكاهة والعموم، نحن نستخدم نموذجا يعتمد على ألبرت يستخدم ألبرت كوحدة لاستخراج ميزات النص.نقوم بتعديل هيكل الطبقة العليا عن طريق إضافة شبكات محد دة لتلخيص المعلومات الدلالية بشكل أفضل.أخيرا، يحقق نظامنا درجة F 0.9348 في الفرعية 1A، RMSE من 0.7214 في الفرعية 1B، F-Score من 0.4603 في SubTask 1C، و RMSE من 0.5204 في SubTask 2.
التعرف الفكاهي هو مهمة صعبة في معالجة اللغة الطبيعية.تقدم هذه الوثيقة مناهجاتي للكشف عن الفكاهة والجريمة من النص المحدد.تتضمن هذه المهمة مهام 2: المهمة 1 التي تحتوي على 3 مجموعات فرعية (1A، 1B، و 1C)، والمهمة 2. يمكن اعتبار 1A SubTask 1A و 1C مشاكل ا لتصنيف واتخاذ ألبرت كنموذج أساسي.SubTask 1B و 2 يمكن أن ينظر إليها على أنها قضايا الانحدار وتأخذ روبرتا كنموذج أساسي.
تقدم هذه الورقة تقديم Duluthnlp إلى المهمة 7 من مسابقة Semeval 2021 بشأن الكشف عن الفكاهة والجريمة تصنيفها.في ذلك، نوضح النهج المستخدم لتدريب النموذج مع عملية ضبط النموذج الخاص بنا في الحصول على النتائج.ونحن نركز على الكشف عن الفكاهة والتصنيف والتصني ف الفاسد، وهو ما يمثل ثلاثة من الأساس الأربع الفرعية التي قدمت.نظهر أن تحسين المعلمات فرطا لمعدل التعلم، يمكن أن يزيد حجم الدفعة وعدد EFOCHs من الدقة ونتيجة F1 للكشف عن الفكاهة
تصف هذه الورقة النظام المستخدم للكشف عن الفكاهة في النص.يستخدم النظام الذي طوره فريق Techssn تقنيات التصنيف الثنائية لتصنيف النص.تخضع البيانات للبيانات المعالجة المسبقة وتعطى لكولبرت (التفاعل المتأخر السياسي على بيرت)، وهو تعديل تمثيل التشفير ثنائي ا لاتجاه من المحولات (بيرت).يتم إعادة تدريب النموذج ويتم تعلم الأوزان في DataSet.تم تطوير هذا النظام للمهمة 7 من المسابقة، Semeval 2021.
Semeval 2021 المهمة 7، Hahackathon، كانت أول مهمة مشتركة للجمع بين المجالات المنفصلة سابقا من الكشف عن الفكاهة والكشف عن الجريمة. جمعنا 10000 نص من تويتر ومجموعات بيانات النكات القصيرة في Kaggle، وكان كل منها مشروح من الفكاهة والجريمة بمقدار 20 حديثا في سن 18-70. كانتنا فرعيتنا الفرعية للكشف عن الفكاهة الثنائية، والتنبؤ بتصنيفات الفكاهة والجريمة، ومهمة جدل جديدة: للتنبؤ إذا كان التباين في تصنيفات الفكاهة أعلى من عتبة محددة. جذبت المهن الفرعية 36-58 طلبا، مع اختيار معظم المشاركين استخدام نماذج اللغة المدربة مسبقا. كما نفذت العديد من الفرق الأعلى الأداء تقنيات تحسين إضافية، بما في ذلك التدريب على المهام على التكيف والتدريب الخصم. تشير النتائج إلى أن النظم المشاركة مناسبة تماما للكشف عن الفكاهة، ولكن هذه الخلافات الفكاهة مهمة أكثر تحديا. نناقش النماذج التي تتفوق في هذه المهمة، والتي تعزز التقنيات الإضافية أدائها، وتحليل الأخطاء التي لم يتم التقاطها من قبل أفضل الأنظمة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا