ترغب بنشر مسار تعليمي؟ اضغط هنا

CSECU-DSG في Semeval-2021 المهمة 7: الكشف والتصنيف الفكاهة والجريمة التي توظف المحولات

CSECU-DSG at SemEval-2021 Task 7: Detecting and Rating Humor and Offense Employing Transformers

232   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مع الاتجاهات الناشئة لاستخدام المنصات عبر الإنترنت، فإن الشعوب مهتمة بشكل متزايد بالتعبير عن رأيهم من خلال نصوص روح الدعابة.تحديد ونصوص فكاهة التصنيف يشكل تحديات فريدة من نوعها إلى NLP بسبب الظواهر الذاتية I.E. قد تختلف الفكاهة إلى النوع الاجتماعي والمهنة والعمر وفوسات الناس.بالإضافة إلى ذلك، يجب مراعات الكلمات ذات الحواس المتعددة والمجال الثقافي والكفاءة العملية.قد يكون نص مضحك مسيئا للآخرين.لمعالجة هذه التحديات، أدخلت Semeval-2021 مهمة Hahackathon التي تركز على الكشف عن النصوص والتصنيف الفاضح والنصوص الهجومية.تصف هذه الورقة مشاركتنا في هذه المهمة.عملنا تضمين مكدسة ونماذج التصنيف القائم على نماذج المحولات التي تم ضبطها من الميزات من موديلات GPT2 Medium، Bert، وروبرتا المحول.علاوة على ذلك، استخدمنا نماذج بيرت ذات صقل وروبرتا لدراسة العروض.حققت طريقنا عروضا تنافسية في هذه المهمة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توضح هذه الورقة مساهمتنا في مهمة Semeval-2021: الكشف عن الفكاهة وتصنيف المهمة وتصنيف المهمة الخاصة بهذه المهام الفرعية، المهمة الفرعية 1 ومهمة فرعية 2. من بينها، المهمة الفرعية 1 المهام الفرعية الفرعية، المهمة الفرعية 1A، المهمة الفرعية 1B والمهمة ال فرعية 1C.SUB المهمة 1A هي التنبؤ إذا كان النص من شأنه أن يصبح النص من روح الدعابة. تم وصف المهمة الأولى 1C asfollows: إذا تم تصنيف النص على الرفاهية، فإن تصنيف الفكاهة تعتبر التخلف عن السياقة، أي أن تباين التصنيف بين Annota-tors أعلى من المتوسط. جنبا إلى جددنا نموذجا مدربا في ثلاثpre مع CNN لاستكمال هذه المهام الفرعية التنسيقية. -Task 2 يهدف إلى التنبؤ بكيفية النص الموضح مع القيم بين 0 و 5.We نستخدم فكرة الانحدار للتعامل مع المهمة الفرعية Thesetwo. نحلل أداء أورمثود وإظهار مساهمة كل كومكونت من بنية لدينا. لقد حققنا نتائج جيدة تحت مجموعة من وضع ما قبل التدريب المتعدد طرق LS والتحسين.
Semeval 2021 المهمة 7، Hahackathon، كانت أول مهمة مشتركة للجمع بين المجالات المنفصلة سابقا من الكشف عن الفكاهة والكشف عن الجريمة. جمعنا 10000 نص من تويتر ومجموعات بيانات النكات القصيرة في Kaggle، وكان كل منها مشروح من الفكاهة والجريمة بمقدار 20 حديثا في سن 18-70. كانتنا فرعيتنا الفرعية للكشف عن الفكاهة الثنائية، والتنبؤ بتصنيفات الفكاهة والجريمة، ومهمة جدل جديدة: للتنبؤ إذا كان التباين في تصنيفات الفكاهة أعلى من عتبة محددة. جذبت المهن الفرعية 36-58 طلبا، مع اختيار معظم المشاركين استخدام نماذج اللغة المدربة مسبقا. كما نفذت العديد من الفرق الأعلى الأداء تقنيات تحسين إضافية، بما في ذلك التدريب على المهام على التكيف والتدريب الخصم. تشير النتائج إلى أن النظم المشاركة مناسبة تماما للكشف عن الفكاهة، ولكن هذه الخلافات الفكاهة مهمة أكثر تحديا. نناقش النماذج التي تتفوق في هذه المهمة، والتي تعزز التقنيات الإضافية أدائها، وتحليل الأخطاء التي لم يتم التقاطها من قبل أفضل الأنظمة.
التعرف الفكاهي هو مهمة صعبة في معالجة اللغة الطبيعية.تقدم هذه الوثيقة مناهجاتي للكشف عن الفكاهة والجريمة من النص المحدد.تتضمن هذه المهمة مهام 2: المهمة 1 التي تحتوي على 3 مجموعات فرعية (1A، 1B، و 1C)، والمهمة 2. يمكن اعتبار 1A SubTask 1A و 1C مشاكل ا لتصنيف واتخاذ ألبرت كنموذج أساسي.SubTask 1B و 2 يمكن أن ينظر إليها على أنها قضايا الانحدار وتأخذ روبرتا كنموذج أساسي.
الهوكاثون: كشف وتصنيف الفكاهة والجريمة "مهمة في المنافسة في Semeval 2021 تركز على الكشف عن مستوى الفكاهة والتقييم في الجمل، وكذلك مستوى اللياء الوارد في هذه النصوص مع النغمات الفكاهية.في هذه الورقة، نقدم نهجا يعتمد على تقنيات التعلم العميقة الأخيرة م ن خلال محاولة تدريب النماذج القائمة على مجموعة البيانات فقط ومحاولة ضبط النماذج المدربة مسبقا على Corpus Gigantic.
في هذه الورقة، نصف النظم المستخدمة من قبل فريق الروما في المهمة المشتركة بشأن الكشف عن الفكاهة والفكاهة والجريمة (HAHAHACHATHON) في Semeval 2021. تعتمد أنظمتنا على تمثيلات البيانات المستفادة من خلال نماذج اللغة العصبية التي تم ضبطها بشكل جيد. على وجه الخصوص، نستكشف اثنين من البدينات المميزة. يعتمد أول واحد على شبكة عصبية سيام (SNN) مجتمعة مع طريقة التجميع المستندة إلى الرسم البياني. يستخدم نموذج SNN لتعلم مساحة كامنة حيث يمكن تمييز مثيلات الفكاهة وغير الفكاهة. يتم تطبيق طريقة التجميع لبناء النماذج الأولية لكلتا الفئتين المستخدمة في تدريب وتصنيف الرسائل الجديدة. يجمع المرء الثاني بين تمثيلات نموذج اللغة العصبية مع نموذج الانحدار الخطي الذي يجعل التصنيفات النهائية. حققت أنظمتنا أفضل نتائج لتصنيف فكاهة باستخدام نموذج واحد، في حين أن التصنيف الهجومي والفكاهة، حصل النموذج الثاني على أداء أفضل. في حالة التنبؤ الفكاهة المثيرة للجدل، تم تحقيق أهم تحسن من خلال ضبط طراز اللغة العصبية. بشكل عام، فإن النتائج المحققة مشجعة وتعطينا نقطة انطلاق لمزيد من التحسينات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا