Semeval 2021 المهمة 7، Hahackathon، كانت أول مهمة مشتركة للجمع بين المجالات المنفصلة سابقا من الكشف عن الفكاهة والكشف عن الجريمة. جمعنا 10000 نص من تويتر ومجموعات بيانات النكات القصيرة في Kaggle، وكان كل منها مشروح من الفكاهة والجريمة بمقدار 20 حديثا في سن 18-70. كانتنا فرعيتنا الفرعية للكشف عن الفكاهة الثنائية، والتنبؤ بتصنيفات الفكاهة والجريمة، ومهمة جدل جديدة: للتنبؤ إذا كان التباين في تصنيفات الفكاهة أعلى من عتبة محددة. جذبت المهن الفرعية 36-58 طلبا، مع اختيار معظم المشاركين استخدام نماذج اللغة المدربة مسبقا. كما نفذت العديد من الفرق الأعلى الأداء تقنيات تحسين إضافية، بما في ذلك التدريب على المهام على التكيف والتدريب الخصم. تشير النتائج إلى أن النظم المشاركة مناسبة تماما للكشف عن الفكاهة، ولكن هذه الخلافات الفكاهة مهمة أكثر تحديا. نناقش النماذج التي تتفوق في هذه المهمة، والتي تعزز التقنيات الإضافية أدائها، وتحليل الأخطاء التي لم يتم التقاطها من قبل أفضل الأنظمة.
SemEval 2021 Task 7, HaHackathon, was the first shared task to combine the previously separate domains of humor detection and offense detection. We collected 10,000 texts from Twitter and the Kaggle Short Jokes dataset, and had each annotated for humor and offense by 20 annotators aged 18-70. Our subtasks were binary humor detection, prediction of humor and offense ratings, and a novel controversy task: to predict if the variance in the humor ratings was higher than a specific threshold. The subtasks attracted 36-58 submissions, with most of the participants choosing to use pre-trained language models. Many of the highest performing teams also implemented additional optimization techniques, including task-adaptive training and adversarial training. The results suggest that the participating systems are well suited to humor detection, but that humor controversy is a more challenging task. We discuss which models excel in this task, which auxiliary techniques boost their performance, and analyze the errors which were not captured by the best systems.
المراجع المستخدمة
https://aclanthology.org/
الهوكاثون: كشف وتصنيف الفكاهة والجريمة "مهمة في المنافسة في Semeval 2021 تركز على الكشف عن مستوى الفكاهة والتقييم في الجمل، وكذلك مستوى اللياء الوارد في هذه النصوص مع النغمات الفكاهية.في هذه الورقة، نقدم نهجا يعتمد على تقنيات التعلم العميقة الأخيرة م
الفكاهة والتصنيف يشكل تحديات لغوية مثيرة للاهتمام إلى NLP؛إنها ذاتية عالية اعتمادا على تصورات مزحة والسياق الذي يستخدم فيه.تستخدم هذه الورقة ويقارن نماذج المحولات؛Bert Base و Large، Bertweet، Roberta Base and Large، مفارقة قاعدة روبرتا، للكشف عن الفك
تقدم هذه المقالة تقديم الفرعية 1 و SubTask 2 الذي نشارك فيه في مهمة Semeval-2021 7: Hahackathon: الكشف عن الفكاهة والعموم، نحن نستخدم نموذجا يعتمد على ألبرت يستخدم ألبرت كوحدة لاستخراج ميزات النص.نقوم بتعديل هيكل الطبقة العليا عن طريق إضافة شبكات محد
توضح هذه الورقة مساهمتنا في مهمة Semeval-2021: الكشف عن الفكاهة وتصنيف المهمة وتصنيف المهمة الخاصة بهذه المهام الفرعية، المهمة الفرعية 1 ومهمة فرعية 2. من بينها، المهمة الفرعية 1 المهام الفرعية الفرعية، المهمة الفرعية 1A، المهمة الفرعية 1B والمهمة ال
التعرف الفكاهي هو مهمة صعبة في معالجة اللغة الطبيعية.تقدم هذه الوثيقة مناهجاتي للكشف عن الفكاهة والجريمة من النص المحدد.تتضمن هذه المهمة مهام 2: المهمة 1 التي تحتوي على 3 مجموعات فرعية (1A، 1B، و 1C)، والمهمة 2. يمكن اعتبار 1A SubTask 1A و 1C مشاكل ا