مع الاتجاهات الناشئة لاستخدام المنصات عبر الإنترنت، فإن الشعوب مهتمة بشكل متزايد بالتعبير عن رأيهم من خلال نصوص روح الدعابة.تحديد ونصوص فكاهة التصنيف يشكل تحديات فريدة من نوعها إلى NLP بسبب الظواهر الذاتية I.E. قد تختلف الفكاهة إلى النوع الاجتماعي والمهنة والعمر وفوسات الناس.بالإضافة إلى ذلك، يجب مراعات الكلمات ذات الحواس المتعددة والمجال الثقافي والكفاءة العملية.قد يكون نص مضحك مسيئا للآخرين.لمعالجة هذه التحديات، أدخلت Semeval-2021 مهمة Hahackathon التي تركز على الكشف عن النصوص والتصنيف الفاضح والنصوص الهجومية.تصف هذه الورقة مشاركتنا في هذه المهمة.عملنا تضمين مكدسة ونماذج التصنيف القائم على نماذج المحولات التي تم ضبطها من الميزات من موديلات GPT2 Medium، Bert، وروبرتا المحول.علاوة على ذلك، استخدمنا نماذج بيرت ذات صقل وروبرتا لدراسة العروض.حققت طريقنا عروضا تنافسية في هذه المهمة.
With the emerging trends of using online platforms, peoples are increasingly interested in express their opinion through humorous texts. Identifying and rating humorous texts poses unique challenges to NLP due to subjective phenomena i.e. humor may vary to gender, profession, age, and classes of people. Besides, words with multiple senses, cultural domain, and pragmatic competence also need to be considered. A humorous text may be offensive to others. To address these challenges SemEval-2021 introduced a HaHackathon task focusing on detecting and rating humorous and offensive texts. This paper describes our participation in this task. We employed a stacked embedding and fine-tuned transformer models based classification and regression approach from the features from GPT2 medium, BERT, and RoBERTa transformer models. Besides, we utilized the fine-tuned BERT and RoBERTa models to examine the performances. Our method achieved competitive performances in this task.
References used
https://aclanthology.org/
This paper describes our contribution to SemEval-2021 Task 7: Detecting and Rating Humor and Of-fense.This task contains two sub-tasks, sub-task 1and sub-task 2. Among them, sub-task 1 containsthree sub-tasks, sub-task 1a ,sub-task 1b and sub-task 1c
SemEval 2021 Task 7, HaHackathon, was the first shared task to combine the previously separate domains of humor detection and offense detection. We collected 10,000 texts from Twitter and the Kaggle Short Jokes dataset, and had each annotated for hum
Humor recognition is a challenging task in natural language processing. This document presents my approaches to detect and rate humor and offense from the given text. This task includes 2 tasks: task 1 which contains 3 subtasks (1a, 1b, and 1c), and
The HaHackathon: Detecting and Rating Humor and Offense'' task at the SemEval 2021 competition focuses on detecting and rating the humor level in sentences, as well as the level of offensiveness contained in these texts with humoristic tones. In this
In this paper we describe the systems used by the RoMa team in the shared task on Detecting and Rating Humor and Offense (HaHackathon) at SemEval 2021. Our systems rely on data representations learned through fine-tuned neural language models. Partic