نقدم نموذجا للتنبؤ بمشاعر غرامة على طول الأبعاد المستمرة من التكافؤ والإثارة والهيمنة (VAD) مع وجود شرح عاطفي قاطع. يتم تدريب طرازنا عن طريق تقليل فقدان EMD (مسافة تحالف الأرض) بين توزيع النتيجة VAD المتوقعة وتوزيع العاطفة الفئوية التي تم فرزها على ط
ول VAD، ويمكن أن تصنف في وقت واحد فئات العاطفة وتتنبؤ بعشرات VAD للحصول على عقوبة معينة. نحن نستخدم Roberta-Large Roberta المدربة مسبقا على ثلاثة كوربورا مختلفة مع ملصقات واضحة وتقييم على Emobank Corpus مع درجات VAD. نظهر أن نهجنا يصل إلى أداء قابلا للمقارنة مع وجود أحدث من المصنفات في تصنيف العاطفة الفئوية ويظهر ارتباطا إيجابيا كبيرا مع درجات فاد للحقيقة الأرضية. أيضا، يؤدي المزيد من التدريب مع الإشراف على تسميات VAD إلى تحسين الأداء خاصة عندما تكون مجموعة البيانات الصغيرة. نقدم أيضا أمثلة على تنبؤات كلمات العاطفة المناسبة التي ليست جزءا من التعليقات التوضيحية الأصلية.
تحديد المشاعر من النص أمر حاسم لمجموعة متنوعة من مهام العالم الحقيقي.نحن نعتبر أكبر فورسورا المتوفر الآن لتصنيف العاطفة الآن: جيموتونات، مع رسائل 58 ألفا تسمى القراء، والتنفيس، مع رسائل 33 مترا مصممة الكاتب.نقوم بتصميم معيارا وتقييم العديد من المساحا
ت الميزة وخوارزميات التعلم، بما في ذلك نموذجين بسيطين ولكن الرواية أعلى بيرت التي تتفوق على خطوط الأساس القوية السابقة على GAEMOTION.من خلال تجربة مع مشاركين بشريين، نحلل أيضا الاختلافات بين كيفية التعبير عن المشاعر وكيفية إدراك القراء لهم.تشير نتائجنا إلى أن العواطف التي أعرب عنها الكتاب أصعب تحديدها من العواطف التي ينظر إليها القراء.نحن نشارك واجهة الويب العامة للباحثين لاستكشاف نماذجنا.
في اللغة الرومانية، هناك بعض الموارد لفهم النص التلقائي، ولكن بالنسبة للكشف عن المشاعر، لا يوجد أساس معجم، لا يوجد شيء. لتغطية هذه الفجوة، استخراجت بيانات من Twitter وإنشاء بيانات DataSet الأولى التي تحتوي على تغريدات مشروحة مع خمسة أنواع من العواطف:
الفرح والخوف والحزن والغضب والمحايد، بقصد استخدام مهام التعدين وتحليل الرأي. في هذه المقالة، نقدم بعض ميزات مجموعة بياناتنا الجديدة، وخلق معيارا لتحقيق أول نموذج لتعلم الآلات الإشراف للكشف عن المشاعر التلقائية في النصوص القصيرة الرومانية. نحقق في أداء أربع نماذج تعلم الآلة الكلاسيكية: بايس ساذجة متعددة الأثر، الانحدار اللوجستي، تصنيف ناقلات الدعم وتصنيف ناقلات الدعم الخطي. نحن نحقق أيضا في المزيد من الأساليب الحديثة مثل FastText، والتي تستخدم معلومات الكلمات الفرعية. أخيرا، نحن نغلق برت الرومانية لتصنيف النص وإظهار تجاربنا أن النموذج القائم على بيرت لديه أفضل أداء لمهمة الكشف عن العاطفة من التغريدات الرومانية. الكلمات المفتاحية: الكشف عن العاطفة، تويتر، الرومانية، التعلم الآلي الإشراف
في الخطوة الأولى نحو تحسين الكشف عن المشاعر الهولندية، نحاول الجمع بين نماذج المحولات الهولندية Bertje والرسم مع الأساليب القائمة على المعجم.نقترح دوران هندستين: واحدة يتم فيها حقن معلومات معجمية مباشرة في طراز المحول ونهج التعلم التلوي حيث يتم دمج ا
لتنبؤات من المحولات مع ميزات المعجم.يتم اختبار النماذج على 1000 تغريدة هولندية و 1000 تعليق من البرامج التلفزيونية التي تم تفاحها يدويا مع فئات العاطفة والأبعاد.نجد أن Robbert تفوق بوضوح Bertje، ولكن هذا يضيف مباشرة معلومات المعجم إلى المحولات لا يحسن الأداء.في نهج التعلم التلوي، أصبحت معلومات المعجم تأثير إيجابي على Bertje، ولكن ليس على Robbert.هذا يشير إلى أن المزيد من المعلومات العاطفية تحتوي بالفعل ضمن نموذج اللغة الأخير.
كشف العاطفة مهمة مهمة يمكن تطبيقها على بيانات وسائل التواصل الاجتماعي لاكتشاف المعرفة الجديدة.في حين أن استخدام طرق التعلم العميق لهذه المهمة كان سائدا، فهي نماذج من الصندوق الأسود، مما يجعل قراراتها بجد لتفسير مشغل بشري.لذلك، في هذه الورقة، نقترح نه
جا باستخدام Kevent Kearbors المرجح (KNN)، وهو نموذج تعليمي بسيط وسهل تنفيذي وشرحه.هذه الصفات يمكن أن تساعد في تعزيز موثوقية النتائج وتحليل الأخطاء التوجيه.على وجه الخصوص، نطبق نموذج KNN المرجح بمهمة الكشف عن العاطفة المشتركة في تغريدات Semeval-2018.يتم تمثيل التغريدات باستخدام أساليب مختلفة لتضمين نصية وعشرات المفردات المعجمية العاطفة، ويتم التصنيف من قبل مجموعة من نماذج KNN المرجحة.تتمتع أفضل أساليبنا بنتائج تنافسية مع حلول حديثة وفتح مسارا بديلا واعدا لأساليب الشبكة العصبية.