في حين أن العواطف جوانب عالمية لعلم النفس البشري، يتم التعبير عنها بشكل مختلف عبر لغات وثقافات مختلفة.نقدم مجموعة بيانات جديدة من أكثر من 530K منشورات عامة من الفيسبوك المجففة في 18 لغة، والتي تحمل تصنيفها بخمس عواطف مختلفة.باستخدام Asbeddings Bert متعدد اللغات، نوضح أن العواطف يمكن استنتاجها بشكل موثوق في الداخل وبين اللغات.يعد التعلم الصفرية النتائج الواعدة لغات الموارد المنخفضة.بعد النظريات المعمارية للعواطف الأساسية، نقدم تحليلا مفصلا لإمكانيات وحدود تصنيف العاطفة عبر اللغات.نجد أن التشابه الهيكلية والنظامي بين اللغات يسهل التعلم عبر اللغات، بالإضافة إلى التنوع اللغوي لبيانات التدريب.تشير نتائجنا إلى أن هناك القواسم المشتركة وراء التعبير عن العاطفة بلغات مختلفة.نطلق علنا البيانات المجهولية للبحث في المستقبل.
While emotions are universal aspects of human psychology, they are expressed differently across different languages and cultures. We introduce a new data set of over 530k anonymized public Facebook posts across 18 languages, labeled with five different emotions. Using multilingual BERT embeddings, we show that emotions can be reliably inferred both within and across languages. Zero-shot learning produces promising results for low-resource languages. Following established theories of basic emotions, we provide a detailed analysis of the possibilities and limits of cross-lingual emotion classification. We find that structural and typological similarity between languages facilitates cross-lingual learning, as well as linguistic diversity of training data. Our results suggest that there are commonalities underlying the expression of emotion in different languages. We publicly release the anonymized data for future research.
المراجع المستخدمة
https://aclanthology.org/
كيف تشرح بيل غيتس إلى الألمانية؟يرتبط بتأسيس شركة في الولايات المتحدة، لذلك ربما يمكن للمؤسس الألماني كارل بنز أن يقف في البوابات في تلك السياقات.يسمى هذا النوع من الترجمة التكيف في مجتمع الترجمة.حتى الآن، لم تتم هذه المهمة بشكل حسابي.يمكن استخدام ال
تعتمد أنظمة متعددة اللغات متعددة اللغات على المفردات المشتركة التي تغطي جميع اللغات التي تغطي بما فيه الكفاية. تحقيقا لهذه الغاية، فإن النهج البسيط والمستعمل بشكل متكرر يستفيد من مفهليات الكلمات الفرعية التي تم إنشاؤها بشكل مشترك على عدة لغات. نحن نف
لوحظت نماذج الترجمة الآلية العصبية (NMT) لإنتاج ترجمات سيئة عندما يكون هناك عدد قليل من الجمل / لا توجد جمل متوازية لتدريب النماذج. في حالة عدم وجود بيانات متوازية، تحولت عدة طرق إلى استخدام الصور لتعلم الترجمات. نظرا لأن صور الكلمات، على سبيل المثال
في هذه الورقة، نضع أنفسنا في سيناريو التصنيف الذي لا يمكن الوصول إليه الطبقات المستهدفة ونوع البيانات أثناء التدريب.نستخدم نهج التعلم التلوي لتحديد ما إذا كانت المعلومات التي تم تدريبها على التلوي من بيانات الشبكة الاجتماعية المشتركة مع ملصقات عاطفة
تعد أنظمة معالجة اللغة الطبيعية (NLP) في قلب العديد من أنظمة صنع القرار الآلي الحرجة التي تجعل توصيات حاسمة حول عالمنا في المستقبل.تم دراسة التحيز بين الجنسين في NLP جيدا باللغة الإنجليزية، لكنها كانت أقل دراستها بلغات أخرى.في هذه الورقة، تضم فريقا ب