خلال السنوات القليلة الماضية، يكون عدد مستخدمي الإنترنت العربي والمحتوى العربي عبر الإنترنت في النمو الأسي.تعتبر التعامل مع مجموعات البيانات العربية واستخدام الجمل غير الصريحة للتعبير عن الرأي هي التحديات الرئيسية في مجال معالجة اللغات الطبيعية.وبالتالي، اكتسبت السخرية وتحليل المعنويات اهتماما كبيرا من مجتمع البحث، وخاصة في هذه اللغة.يمكن تطبيق الكشف التلقائي للاستخراج وتحليل المعنويات باستخدام ثلاث نهج، وهي نهج إشراف على الإشراف وغير الخاضع للإشراف والجاذبية.في هذه الورقة، تم استخدام نموذج يعتمد على خوارزمية لتعلم الآلة الإشراف يسمى آلة ناقلات الدعم (SVM) بهذه العملية.تم تقييم النموذج المقترح باستخدام DataSet Arsarcasm-V2.تمت مقارنة أداء النموذج المقترح مع النماذج الأخرى المقدمة إلى تحليل المعنويات والكشف عن السخرية المهمة المشتركة.
Within the last few years, the number of Arabic internet users and Arabic online content is in exponential growth. Dealing with Arabic datasets and the usage of non-explicit sentences to express an opinion are considered to be the major challenges in the field of natural language processing. Hence, sarcasm and sentiment analysis has gained a major interest from the research community, especially in this language. Automatic sarcasm detection and sentiment analysis can be applied using three approaches, namely supervised, unsupervised and hybrid approach. In this paper, a model based on a supervised machine learning algorithm called Support Vector Machine (SVM) has been used for this process. The proposed model has been evaluated using ArSarcasm-v2 dataset. The performance of the proposed model has been compared with other models submitted to sentiment analysis and sarcasm detection shared task.
المراجع المستخدمة
https://aclanthology.org/
تم إدخال نماذج اللغة القائمة على المحولات خطوة ثورية لأبحاث معالجة اللغة الطبيعية (NLP). أدت هذه النماذج، مثل Bert، GPT و Electra، إلى أداء أحدث في العديد من مهام NLP. تم تطوير معظم هذه النماذج في البداية للغة الإنجليزية ولغات أخرى تبعها لاحقا. في ال
تقدم هذه الورقة استراتيجيتنا لمعالجة المهمة المشتركة EACL WANLP-2021: السخرية والكشف عن المعنويات.يهدف أحد المهن الفرعية إلى تطوير نظام يحدد ما إذا كانت سقسقة عربية معينة ساخرة في الطبيعة أم لا، في حين أن الآخر يهدف إلى تحديد مشاعر سقسقة اللغة العربي
تجذب تصنيف المعنويات والكشف عن السخرية الكثير من الاهتمام من قبل مجتمع البحوث NLP. ومع ذلك، فإن حل هاتين المشكلتين باللغة العربية وعلى أساس بيانات الشبكة الاجتماعية (I.E.، Twitter) لا يزال مصلحة أقل. في هذه الورقة نقدم حلولا مخصصة لتصنيف المعنويات وم
وصفنا نظامنا المقدم لهذه المهمة المشتركة 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية (أبو فرحة وآخرون، 2021).لقد تناولنا كل من المجموعات الفرعية، وهما اكتشاف السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).استخدمنا نماذج تمثيل نصية محكومة لل
نقدم ثلاث طرق تم تطويرها للمهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية.نقدم خط الأساس الذي يستخدم ميزات شخصية N-Gram.نقترح أيضا طريقتين أكثر تطورا: شبكة عصبية متكررة مع تمثيل مستوى الكلمة وتصنيف الفرقة تعتمد على ميزات Word ومستوى ال