كانت هناك عدة محاولات لإنشاء معجم عاطفي دقيق وشامل باللغة الإنجليزية، والذي يحدد المحتوى العاطفي للكلمات. من بين العديد من الموارد الشائعة الاستخدام، تلقت معجم NRC Emption (Mohammad and Turney، 2013B) معظم الاهتمام بسبب توافرها وحجمها واختيارها لنموذج PLUTCHIVE التعبيري 8-Close Model. في هذه الورقة، نحدد عدد كبير من الإدخالات المقلقة في معجم NRC، حيث تكون الكلمات التي ينبغي أن تكون في معظم السياقات محايدة عاطفيا، دون أي تأثير (على سبيل المثال، مثليه، الحجر "، الجبل")، ترتبط بالملصقات العاطفية التي هي غير دقيقة، غير رسمية، تقشير، أو، في أحسن الأحوال، المعتمدة للغاية والسياق (على سبيل المثال، مثليه "المسمى بالاشمئزاز والحزن، والحجر" كغضب، أو جبل "كما يتيح). نحن نصف إجراء إجراء لتصحيح هذه المشكلات شبه تلقائيا في NRC، والذي يتضمن فئات POS Disbigiguating ومحاذاة إدخالات NRC مع طمامة العاطفة الأخرى لاستنتاج دقة الملصقات. نوضح عبر معيار تجريبي يتم تحسين جودة الموارد. نقوم بإصدار المورد المنقح وشمزنا لتمكين الباحثين الآخرين من إعادة إنتاج والبناء عند النتائج.
There have been several attempts to create an accurate and thorough emotion lexicon in English, which identifies the emotional content of words. Of the several commonly used resources, the NRC emotion lexicon (Mohammad and Turney, 2013b) has received the most attention due to its availability, size, and its choice of Plutchik's expressive 8-class emotion model. In this paper we identify a large number of troubling entries in the NRC lexicon, where words that should in most contexts be emotionally neutral, with no affect (e.g., lesbian', stone', mountain'), are associated with emotional labels that are inaccurate, nonsensical, pejorative, or, at best, highly contingent and context-dependent (e.g., lesbian' labeled as Disgust and Sadness, stone' as Anger, or mountain' as Anticipation). We describe a procedure for semi-automatically correcting these problems in the NRC, which includes disambiguating POS categories and aligning NRC entries with other emotion lexicons to infer the accuracy of labels. We demonstrate via an experimental benchmark that the quality of the resources is thus improved. We release the revised resource and our code to enable other researchers to reproduce and build upon results.
المراجع المستخدمة
https://aclanthology.org/