تصف هذه الورقة النهج الذي تم تطويره لمهمة Semeval 2021 7 (Hahackathon: دمج العوامل الديموغرافية في مهام فكاهة مشتركة) من قبل فريق Duth.استخدمنا ومقارننا مجموعة متنوعة من تقنيات المعالجة المسبقة، وأساليب Vectorization، وعديد من خوارزميات التعلم الآلات التقليدية، من أجل بناء نماذج التصنيف والانحدار للمهام المعينة.استخدمنا التصويت الأغلبية للجمع بين مخرجات النماذج مع الشبكات العصبية الصغيرة (NN) لمهام التصنيف ومتوسطها لانحدارها لتحسين أداء نظامنا.في حين أثبتت هذه الطرق أضعف من نماذج التعلم الحديثة والعميقة، فإنها لا تزال ذات صلة في مهام البحث بسبب انخفاض احتياطيها على السلطة الحاسوبية والتدريب الأسرع.
This paper describes the approach that was developed for SemEval 2021 Task 7 (Hahackathon: Incorporating Demographic Factors into Shared Humor Tasks) by the DUTH Team. We used and compared a variety of preprocessing techniques, vectorization methods, and numerous conventional machine learning algorithms, in order to construct classification and regression models for the given tasks. We used majority voting to combine the models' outputs with small Neural Networks (NN) for classification tasks and their mean for regression for improving our system's performance. While these methods proved weaker than modern, deep learning models, they are still relevant in research tasks because of their low requirements on computational power and faster training.
المراجع المستخدمة
https://aclanthology.org/
أصبح الكشف عن الفكاهة موضوع اهتمام بالعديد من فرق البحث، وخاصة المشاركين في الدراسات الاجتماعية والنفسية، بهدف الكشف عن الفكاهة والأشجار السكانية المستهدفة (مثل مجتمع، مدينة، أي بلد، موظفوشركة معينة).قامت معظم الدراسات الحالية بصياغة مشكلة الكشف عن ا
الفكاهة والتصنيف يشكل تحديات لغوية مثيرة للاهتمام إلى NLP؛إنها ذاتية عالية اعتمادا على تصورات مزحة والسياق الذي يستخدم فيه.تستخدم هذه الورقة ويقارن نماذج المحولات؛Bert Base و Large، Bertweet، Roberta Base and Large، مفارقة قاعدة روبرتا، للكشف عن الفك
تصف هذه الورقة نظامنا المشارك في المهمة 7 من Semeval-2021: الكشف عن الفكاهة والجريمة.تم تصميم المهمة للكشف عن الفكاهة والجريمة التي تتأثر بالعوامل الذاتية.من أجل الحصول على معلومات دلالية من كمية كبيرة من البيانات غير المسبقة، طبقنا نماذج اللغة المدر
توضح هذه الورقة مساهمتنا في مهمة Semeval-2021: الكشف عن الفكاهة وتصنيف المهمة وتصنيف المهمة الخاصة بهذه المهام الفرعية، المهمة الفرعية 1 ومهمة فرعية 2. من بينها، المهمة الفرعية 1 المهام الفرعية الفرعية، المهمة الفرعية 1A، المهمة الفرعية 1B والمهمة ال
تصف هذه الورقة نهجنا (IITH) لمهمة Semeval-2021 5: hahackathon: الكشف عن الفكاهة والجريمة.تركز نتائجنا على هدفين رئيسيين: (1) تأثير الاحتجاج في تكيف المهمة على أداء النماذج القائمة على المحولات (II) كيف يتميز ميزات المعجمية والمؤثرية في تحديد الفكاهة