ترغب بنشر مسار تعليمي؟ اضغط هنا

HUMORHunter في Semeval-2021 المهمة 7: الفكاهة والاعتراف بالجريمة مع انتباه المنفذ

HumorHunter at SemEval-2021 Task 7: Humor and Offense Recognition with Disentangled Attention

51   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نصف نظامنا المقدم إلى Semeval 2021 المهمة 7: hahackathon: الكشف عن الفكاهة والعموم. تهدف المهمة إلى التنبؤ بما إذا كان النص المحدد مضحك، فإن التصنيف الفكاهي المتوسط ​​الذي قدمه المعلقون، وما إذا كان تصنيف فكاهة مثيرة للجدل. بالإضافة إلى ذلك، تتضمن المهمة أيضا التنبؤ بمدى مسيئة النص. يتبنى نهجنا بنية Deberta مع آلية اهتمام DESRTANGLED، حيث يتم احتساب درجات الاهتمام بين الكلمات بناء على ناقلات المحتوى ونوافذ المنافذ النسبي. استفادنا أيضا من النماذج اللغوية المدربة مسبقا وصنع نموذج Deberta على جميع المهام الفرعية الأربعة. جربنا العديد من الهياكل التي تشبه بيرت ووجدت أن نموذج Deberta الكبير يعمل بشكل أفضل بشكل أفضل. خلال مرحلة التقييم، حقق نظامنا درجة F 0.9480 على الفرقة الفرعية 1A، ورمز من 0.5510 على الفرقة الفرعية 1B، درجة F 0.4764 على المراكب الفرعية 1C، و RMSE من 0.4230 على الفئة الفرعية 2A (المرتبة 3 على المتصدرين ).

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

التعرف الفكاهي هو مهمة صعبة في معالجة اللغة الطبيعية.تقدم هذه الوثيقة مناهجاتي للكشف عن الفكاهة والجريمة من النص المحدد.تتضمن هذه المهمة مهام 2: المهمة 1 التي تحتوي على 3 مجموعات فرعية (1A، 1B، و 1C)، والمهمة 2. يمكن اعتبار 1A SubTask 1A و 1C مشاكل ا لتصنيف واتخاذ ألبرت كنموذج أساسي.SubTask 1B و 2 يمكن أن ينظر إليها على أنها قضايا الانحدار وتأخذ روبرتا كنموذج أساسي.
Semeval 2021 المهمة 7، Hahackathon، كانت أول مهمة مشتركة للجمع بين المجالات المنفصلة سابقا من الكشف عن الفكاهة والكشف عن الجريمة. جمعنا 10000 نص من تويتر ومجموعات بيانات النكات القصيرة في Kaggle، وكان كل منها مشروح من الفكاهة والجريمة بمقدار 20 حديثا في سن 18-70. كانتنا فرعيتنا الفرعية للكشف عن الفكاهة الثنائية، والتنبؤ بتصنيفات الفكاهة والجريمة، ومهمة جدل جديدة: للتنبؤ إذا كان التباين في تصنيفات الفكاهة أعلى من عتبة محددة. جذبت المهن الفرعية 36-58 طلبا، مع اختيار معظم المشاركين استخدام نماذج اللغة المدربة مسبقا. كما نفذت العديد من الفرق الأعلى الأداء تقنيات تحسين إضافية، بما في ذلك التدريب على المهام على التكيف والتدريب الخصم. تشير النتائج إلى أن النظم المشاركة مناسبة تماما للكشف عن الفكاهة، ولكن هذه الخلافات الفكاهة مهمة أكثر تحديا. نناقش النماذج التي تتفوق في هذه المهمة، والتي تعزز التقنيات الإضافية أدائها، وتحليل الأخطاء التي لم يتم التقاطها من قبل أفضل الأنظمة.
الفكاهة والتصنيف يشكل تحديات لغوية مثيرة للاهتمام إلى NLP؛إنها ذاتية عالية اعتمادا على تصورات مزحة والسياق الذي يستخدم فيه.تستخدم هذه الورقة ويقارن نماذج المحولات؛Bert Base و Large، Bertweet، Roberta Base and Large، مفارقة قاعدة روبرتا، للكشف عن الفك اهة والفكاهة.النماذج المقترحة، حيث نظمت نصا في نوع غلاف وغير مقصود تم الحصول عليها من مهمة Semeval-2021: hahackathon: ربط الفكاهة والجريمة عبر الفئات العمرية المختلفة.أعلى نموذج مسجل في المراكب الفرعي الأول: الكشف عن الفكاهة، نموذج Bertweet Base CaseD مع 0.9540 F1-Score، للمرجع الفرعي الثاني: متوسط درجة التصنيف الفكاهي، فهو Bert Large Cased مع الحد الأدنى من RMSE من 0.5555، في المراكز الفرعية الرابعة:متوسط درجة تصنيف الاكتشاف، إنها نموذج Bertweet Base Cased مع الحد الأدنى من RMSE من 0.4822.
توضح هذه الورقة مساهمتنا في مهمة Semeval-2021: الكشف عن الفكاهة وتصنيف المهمة وتصنيف المهمة الخاصة بهذه المهام الفرعية، المهمة الفرعية 1 ومهمة فرعية 2. من بينها، المهمة الفرعية 1 المهام الفرعية الفرعية، المهمة الفرعية 1A، المهمة الفرعية 1B والمهمة ال فرعية 1C.SUB المهمة 1A هي التنبؤ إذا كان النص من شأنه أن يصبح النص من روح الدعابة. تم وصف المهمة الأولى 1C asfollows: إذا تم تصنيف النص على الرفاهية، فإن تصنيف الفكاهة تعتبر التخلف عن السياقة، أي أن تباين التصنيف بين Annota-tors أعلى من المتوسط. جنبا إلى جددنا نموذجا مدربا في ثلاثpre مع CNN لاستكمال هذه المهام الفرعية التنسيقية. -Task 2 يهدف إلى التنبؤ بكيفية النص الموضح مع القيم بين 0 و 5.We نستخدم فكرة الانحدار للتعامل مع المهمة الفرعية Thesetwo. نحلل أداء أورمثود وإظهار مساهمة كل كومكونت من بنية لدينا. لقد حققنا نتائج جيدة تحت مجموعة من وضع ما قبل التدريب المتعدد طرق LS والتحسين.
تقدم هذه المقالة تقديم الفرعية 1 و SubTask 2 الذي نشارك فيه في مهمة Semeval-2021 7: Hahackathon: الكشف عن الفكاهة والعموم، نحن نستخدم نموذجا يعتمد على ألبرت يستخدم ألبرت كوحدة لاستخراج ميزات النص.نقوم بتعديل هيكل الطبقة العليا عن طريق إضافة شبكات محد دة لتلخيص المعلومات الدلالية بشكل أفضل.أخيرا، يحقق نظامنا درجة F 0.9348 في الفرعية 1A، RMSE من 0.7214 في الفرعية 1B، F-Score من 0.4603 في SubTask 1C، و RMSE من 0.5204 في SubTask 2.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا