تحديد المشاعر من النص أمر حاسم لمجموعة متنوعة من مهام العالم الحقيقي.نحن نعتبر أكبر فورسورا المتوفر الآن لتصنيف العاطفة الآن: جيموتونات، مع رسائل 58 ألفا تسمى القراء، والتنفيس، مع رسائل 33 مترا مصممة الكاتب.نقوم بتصميم معيارا وتقييم العديد من المساحات الميزة وخوارزميات التعلم، بما في ذلك نموذجين بسيطين ولكن الرواية أعلى بيرت التي تتفوق على خطوط الأساس القوية السابقة على GAEMOTION.من خلال تجربة مع مشاركين بشريين، نحلل أيضا الاختلافات بين كيفية التعبير عن المشاعر وكيفية إدراك القراء لهم.تشير نتائجنا إلى أن العواطف التي أعرب عنها الكتاب أصعب تحديدها من العواطف التي ينظر إليها القراء.نحن نشارك واجهة الويب العامة للباحثين لاستكشاف نماذجنا.
Identifying emotions from text is crucial for a variety of real world tasks. We consider the two largest now-available corpora for emotion classification: GoEmotions, with 58k messages labelled by readers, and Vent, with 33M writer-labelled messages. We design a benchmark and evaluate several feature spaces and learning algorithms, including two simple yet novel models on top of BERT that outperform previous strong baselines on GoEmotions. Through an experiment with human participants, we also analyze the differences between how writers express emotions and how readers perceive them. Our results suggest that emotions expressed by writers are harder to identify than emotions that readers perceive. We share a public web interface for researchers to explore our models.
المراجع المستخدمة
https://aclanthology.org/
نقدم نموذجا للتنبؤ بمشاعر غرامة على طول الأبعاد المستمرة من التكافؤ والإثارة والهيمنة (VAD) مع وجود شرح عاطفي قاطع. يتم تدريب طرازنا عن طريق تقليل فقدان EMD (مسافة تحالف الأرض) بين توزيع النتيجة VAD المتوقعة وتوزيع العاطفة الفئوية التي تم فرزها على ط
يمكن اكتشاف الوظائف الإخبارية الخادعة المشتركة في المجتمعات عبر الإنترنت مع نماذج NLP، وقد ركزت البحوث الحديثة الكثير على تطوير هذه النماذج.في هذا العمل، نستخدم خصائص المجتمعات والمؤلفين عبر الإنترنت --- سياق كيفية نشر المحتوى - - لشرح أداء نموذج كشف
مشكلة الكشف عن الإجهاد النفسي في الوظائف عبر الإنترنت، وعلى نطاق أوسع، من اكتشاف الناس في محنة أو في حاجة إلى مساعدة، هو تطبيق حساس له القدرة على تفسير النماذج أمر حيوي.هنا، نقدم العمل في استكشاف استخدام مهمة ذات صلة من الناحية الدلوية، والكشف عن الم
برزت الألعاب القائمة على النصوص (TBGS) كخطط مهم لتعزيز التعزيز (RL) في مجال اللغة الطبيعية.الأساليب السابقة باستخدام سياسات الإجراءات القائم على LSTM غير قابلة لإرسالها وغالبا ما تتجاوزت ألعاب التدريب التي تظهر أداء ضعيف لألعاب الاختبار غير المرئية.ن
في حين أن نماذج قوية مدربة مسبقا قد تحسنت بطلاقة نماذج توليد النص، فإن كفاية الدلالة - القدرة على توليد نص مخلص من الدلالة إلى الإدخال - لا تزال قضية ملحوظة. في هذه الورقة، نقدم كفايات دهالية التقييم التلقائية الجديدة، والتي يمكن استخدامها لتقييم نما