ترغب بنشر مسار تعليمي؟ اضغط هنا

Techssn في Semeval-2021 المهمة 7: الفكاهة والكشف عن الجريمة والتصنيف باستخدام embeddings colbert

TECHSSN at SemEval-2021 Task 7: Humor and Offense detection and classification using ColBERT embeddings

320   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة النظام المستخدم للكشف عن الفكاهة في النص.يستخدم النظام الذي طوره فريق Techssn تقنيات التصنيف الثنائية لتصنيف النص.تخضع البيانات للبيانات المعالجة المسبقة وتعطى لكولبرت (التفاعل المتأخر السياسي على بيرت)، وهو تعديل تمثيل التشفير ثنائي الاتجاه من المحولات (بيرت).يتم إعادة تدريب النموذج ويتم تعلم الأوزان في DataSet.تم تطوير هذا النظام للمهمة 7 من المسابقة، Semeval 2021.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

Semeval 2021 المهمة 7، Hahackathon، كانت أول مهمة مشتركة للجمع بين المجالات المنفصلة سابقا من الكشف عن الفكاهة والكشف عن الجريمة. جمعنا 10000 نص من تويتر ومجموعات بيانات النكات القصيرة في Kaggle، وكان كل منها مشروح من الفكاهة والجريمة بمقدار 20 حديثا في سن 18-70. كانتنا فرعيتنا الفرعية للكشف عن الفكاهة الثنائية، والتنبؤ بتصنيفات الفكاهة والجريمة، ومهمة جدل جديدة: للتنبؤ إذا كان التباين في تصنيفات الفكاهة أعلى من عتبة محددة. جذبت المهن الفرعية 36-58 طلبا، مع اختيار معظم المشاركين استخدام نماذج اللغة المدربة مسبقا. كما نفذت العديد من الفرق الأعلى الأداء تقنيات تحسين إضافية، بما في ذلك التدريب على المهام على التكيف والتدريب الخصم. تشير النتائج إلى أن النظم المشاركة مناسبة تماما للكشف عن الفكاهة، ولكن هذه الخلافات الفكاهة مهمة أكثر تحديا. نناقش النماذج التي تتفوق في هذه المهمة، والتي تعزز التقنيات الإضافية أدائها، وتحليل الأخطاء التي لم يتم التقاطها من قبل أفضل الأنظمة.
التعرف الفكاهي هو مهمة صعبة في معالجة اللغة الطبيعية.تقدم هذه الوثيقة مناهجاتي للكشف عن الفكاهة والجريمة من النص المحدد.تتضمن هذه المهمة مهام 2: المهمة 1 التي تحتوي على 3 مجموعات فرعية (1A، 1B، و 1C)، والمهمة 2. يمكن اعتبار 1A SubTask 1A و 1C مشاكل ا لتصنيف واتخاذ ألبرت كنموذج أساسي.SubTask 1B و 2 يمكن أن ينظر إليها على أنها قضايا الانحدار وتأخذ روبرتا كنموذج أساسي.
مع الاتجاهات الناشئة لاستخدام المنصات عبر الإنترنت، فإن الشعوب مهتمة بشكل متزايد بالتعبير عن رأيهم من خلال نصوص روح الدعابة.تحديد ونصوص فكاهة التصنيف يشكل تحديات فريدة من نوعها إلى NLP بسبب الظواهر الذاتية I.E. قد تختلف الفكاهة إلى النوع الاجتماعي وا لمهنة والعمر وفوسات الناس.بالإضافة إلى ذلك، يجب مراعات الكلمات ذات الحواس المتعددة والمجال الثقافي والكفاءة العملية.قد يكون نص مضحك مسيئا للآخرين.لمعالجة هذه التحديات، أدخلت Semeval-2021 مهمة Hahackathon التي تركز على الكشف عن النصوص والتصنيف الفاضح والنصوص الهجومية.تصف هذه الورقة مشاركتنا في هذه المهمة.عملنا تضمين مكدسة ونماذج التصنيف القائم على نماذج المحولات التي تم ضبطها من الميزات من موديلات GPT2 Medium، Bert، وروبرتا المحول.علاوة على ذلك، استخدمنا نماذج بيرت ذات صقل وروبرتا لدراسة العروض.حققت طريقنا عروضا تنافسية في هذه المهمة.
تقدم هذه الورقة تقديم Duluthnlp إلى المهمة 7 من مسابقة Semeval 2021 بشأن الكشف عن الفكاهة والجريمة تصنيفها.في ذلك، نوضح النهج المستخدم لتدريب النموذج مع عملية ضبط النموذج الخاص بنا في الحصول على النتائج.ونحن نركز على الكشف عن الفكاهة والتصنيف والتصني ف الفاسد، وهو ما يمثل ثلاثة من الأساس الأربع الفرعية التي قدمت.نظهر أن تحسين المعلمات فرطا لمعدل التعلم، يمكن أن يزيد حجم الدفعة وعدد EFOCHs من الدقة ونتيجة F1 للكشف عن الفكاهة
توضح هذه الورقة مساهمتنا في مهمة Semeval-2021: الكشف عن الفكاهة وتصنيف المهمة وتصنيف المهمة الخاصة بهذه المهام الفرعية، المهمة الفرعية 1 ومهمة فرعية 2. من بينها، المهمة الفرعية 1 المهام الفرعية الفرعية، المهمة الفرعية 1A، المهمة الفرعية 1B والمهمة ال فرعية 1C.SUB المهمة 1A هي التنبؤ إذا كان النص من شأنه أن يصبح النص من روح الدعابة. تم وصف المهمة الأولى 1C asfollows: إذا تم تصنيف النص على الرفاهية، فإن تصنيف الفكاهة تعتبر التخلف عن السياقة، أي أن تباين التصنيف بين Annota-tors أعلى من المتوسط. جنبا إلى جددنا نموذجا مدربا في ثلاثpre مع CNN لاستكمال هذه المهام الفرعية التنسيقية. -Task 2 يهدف إلى التنبؤ بكيفية النص الموضح مع القيم بين 0 و 5.We نستخدم فكرة الانحدار للتعامل مع المهمة الفرعية Thesetwo. نحلل أداء أورمثود وإظهار مساهمة كل كومكونت من بنية لدينا. لقد حققنا نتائج جيدة تحت مجموعة من وضع ما قبل التدريب المتعدد طرق LS والتحسين.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا