تعتبر الرموز التعبيرية (الصور التوضيحية الرقمية الشعبية) في بعض الأحيان كنوع جديد من كود الكتابة المصطنعة والمتسقة عالميا. على الرغم من عالمياتهم المفترضة، هناك بعض الأدلة على أن الإحساس بالرموز التعبيرية، على وجه التحديد فيما يتعلق بالمشاعر، قد يتغير من اللغة إلى اللغة والثقافة إلى الثقافة. تحقق هذه الورقة ما إذا كان تحليل معنويات الرموز التعبيرية السياقية يتوافق على اللغات العربية والأوروبية. لإجراء هذا التحقيق، نحن، أولا، أنشأ معجم الرموز الرموز التعبيرية العربية (ARAB-ESL). بعد ذلك، استغلنا المعجم الرموز التعبيري الأوروبي الأوروبي الحالي لمقارنة المشاعر المنقولة في كل من العائلتين من اللغات والثقافة (العربية والأوروبية). تظهر النتائج أن العلاقة الزوجية بين المعجمين متسقين من الرموز التعبيرية التي تمثل، على سبيل المثال، قلوب، تعبيرات الوجه، ولغة الجسم. ومع ذلك، من أجل مجموعة فرعية من الرموز التعبيرية (تلك التي تمثل الأشياء والطبيعة والرموز وبعض الأنشطة البشرية)، هناك اختلافات كبيرة في المعنويات التي يتم نقلها. ومن المثير للاهتمام أن المستوى العالي للغاية من التناقض قد يظهر بالمواد التعبيرية الغذائية.
Emoji (the popular digital pictograms) are sometimes seen as a new kind of artificial and universally usable and consistent writing code. In spite of their assumed universality, there is some evidence that the sense of an emoji, specifically in regard to sentiment, may change from language to language and culture to culture. This paper investigates whether contextual emoji sentiment analysis is consistent across Arabic and European languages. To conduct this investigation, we, first, created the Arabic emoji sentiment lexicon (Arab-ESL). Then, we exploited an existing European emoji sentiment lexicon to compare the sentiment conveyed in each of the two families of language and culture (Arabic and European). The results show that the pairwise correlation between the two lexicons is consistent for emoji that represent, for instance, hearts, facial expressions, and body language. However, for a subset of emoji (those that represent objects, nature, symbols, and some human activities), there are large differences in the sentiment conveyed. More interestingly, an extremely high level of inconsistency has been shown with food emoji.
المراجع المستخدمة
https://aclanthology.org/
في وسائل التواصل الاجتماعي، يستخدم المستخدمون بشكل متكرر صور صغيرة تسمى الرموز التعبيرية في مشاركاتها. على الرغم من أن استخدام الرموز التعبيرية في النصوص يلعب دورا رئيسيا في أنظمة الاتصالات الحديثة، فقد تم إيلاء اهتمام أقل في مواقعهم في النصوص المعين
يؤدي المعجم دورا مهما في أنظمة معالجة اللغات الطبيعية وخصوصا انظمة الترجمة الألية، فهو يزود أجزاء المنظومة بالمعلومات الضرورية لعملية الترجمة, وعلى الرغم من وجود العديد من البحوث في إطار معالجة اللغات الطبيعية، لم يكن هناك اهتمام كاف في المعجم وخصوصا المعجم العربي.
البحوث العلمية حول تحليل المشاعر في اللغة العربية محدودة جدا في الوقت الحالي. بينما يوجد العديد من تطبيقات تحليل المشاعر في اللغة الانكليزية, اللغة العربية مازالت تخطو خطى بطيئة في هذا المجال.
في هذا البحث، نقوم بعرض تطبيق حول تحليل المشاعر في اللغ
منذ إنشائها، أدت نماذج اللغة القائمة على المحولات إلى مكاسب أداء مثيرة للإعجاب عبر مهام معالجة لغات طبيعية متعددة. بالنسبة للعربية، يتم تحقيق النتائج الحالية من أحدث البيانات في معظم مجموعات البيانات بواسطة نموذج اللغة العربية. على الرغم من هذه التطو
الكشف عن السخرية هو واحد من أفضل المهام الصعبة في تصنيف النص، لا سيما بالنسبة للغة العربية غير الرسمية بالغشاء النحوي والدلي العالي.نقترح أنظمتين تسخير المعرفة من مهام متعددة لتحسين أداء المصنف.تقدم هذه الورقة أنظمة المستخدمة في مشاركتنا إلى المهام ا