سنلقاشر 17000 وظيفة SNS مع كل من الكثافة العاطفية الشخصية للكاتب وهدف القارئ واحد لبناء مجموعة بيانات تحليل العاطفة اليابانية.في هذه الدراسة، نستكشف الفرق بين الكثافة العاطفية للكاتب والقراء مع هذه البيانات.وجدنا أن القارئ لا يمكن أن يكتشف تماما عواطف الكاتب، وخاصة الغضب والثقة.بالإضافة إلى ذلك، تظهر النتائج التجريبية في تقدير الشدة العاطفية أنه من الصعب تقدير الملصقات الشخصية للكاتب من القراء.الفجوة الكبيرة بين المشاعر الذاتية والموضوعية تعني تعقيد التعيين من منشور إلى شدة العاطفة الذاتية، والتي تؤدي أيضا إلى أداء أقل مع نماذج تعلم الآلة.
We annotate 17,000 SNS posts with both the writer's subjective emotional intensity and the reader's objective one to construct a Japanese emotion analysis dataset. In this study, we explore the difference between the emotional intensity of the writer and that of the readers with this dataset. We found that the reader cannot fully detect the emotions of the writer, especially anger and trust. In addition, experimental results in estimating the emotional intensity show that it is more difficult to estimate the writer's subjective labels than the readers'. The large gap between the subjective and objective emotions imply the complexity of the mapping from a post to the subjective emotion intensities, which also leads to a lower performance with machine learning models.
المراجع المستخدمة
https://aclanthology.org/
تقدم الورقة موردا جديدا ورمائيا، لدراسة مورفولوجيا تكوين الكلمة السويدية الحديثة.تم تقسيم ما يقرب من 16.000 مادة معجمية في المورد بشكل يدويا إلى مورفيمز تشكيل Word، ومسمى لفئاتها، مثل البادئات والمعقاص والجذور، وما إلى ذلك آليات تكوين كلمة، مثل الاشت
يمكن أن تساعد ردود الفعل التصحيحية التلقائية التلقائي على تعلم اللغة من خلفيات مختلفة اكتساب لغة جديدة بشكل أفضل.تقدم هذه الورقة مجموعة بيانات متعلمة باللغة الإنجليزية التي يرافقها أخطاء المتعلمين معلومات حول مصادر الأخطاء المحتملة.تحتوي مجموعة البيا
تشبه مهمة تبسيط نص الوثيقة على مستوى المستندات إلى صعوبة تقليل التعقيد الإضافي.نقدم مجموعة بيانات مجمعة حديثا من النصوص الألمانية، التي تم جمعها من مجلة Swiss News 20 Minuten (20 دقيقة) والتي تتكون من مقالات كاملة مقررة مع ملخصات مبسطة.علاوة على ذلك،
تتطلب العديد من التطبيقات توليد ملخصات مصممة خصيصا لاحتياجات معلومات المستخدم، أي نواياها. الأساليب التي تعبر عن النية عبر استعلامات المستخدم الصريحة تسقط قصيرة عند التفسير الاستعلام هو شخصي. توجد عدة مجموعات من مجموعات البيانات للتخصيص مع النوايا ال
مع استمرار العالم في محاربة جائحة CovID-19، فإنه يقاتل في وقت واحد من نقص الدم "- وهو طوفان من تضليل وانتشار نظريات المؤامرة المؤدية إلى تهديدات صحية وشعبة المجتمع. لمكافحة هذا المعكرية، هناك حاجة ملحة لمجموعات البيانات القياسية التي يمكن أن تساعد ال