ترغب بنشر مسار تعليمي؟ اضغط هنا

التمهيد: مجموعة بيانات جديدة لتقدير الشدة العاطفية مع التعليقات الإعلانية ذاتية والهدف

WRIME: A New Dataset for Emotional Intensity Estimation with Subjective and Objective Annotations

201   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

سنلقاشر 17000 وظيفة SNS مع كل من الكثافة العاطفية الشخصية للكاتب وهدف القارئ واحد لبناء مجموعة بيانات تحليل العاطفة اليابانية.في هذه الدراسة، نستكشف الفرق بين الكثافة العاطفية للكاتب والقراء مع هذه البيانات.وجدنا أن القارئ لا يمكن أن يكتشف تماما عواطف الكاتب، وخاصة الغضب والثقة.بالإضافة إلى ذلك، تظهر النتائج التجريبية في تقدير الشدة العاطفية أنه من الصعب تقدير الملصقات الشخصية للكاتب من القراء.الفجوة الكبيرة بين المشاعر الذاتية والموضوعية تعني تعقيد التعيين من منشور إلى شدة العاطفة الذاتية، والتي تؤدي أيضا إلى أداء أقل مع نماذج تعلم الآلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم الورقة موردا جديدا ورمائيا، لدراسة مورفولوجيا تكوين الكلمة السويدية الحديثة.تم تقسيم ما يقرب من 16.000 مادة معجمية في المورد بشكل يدويا إلى مورفيمز تشكيل Word، ومسمى لفئاتها، مثل البادئات والمعقاص والجذور، وما إلى ذلك آليات تكوين كلمة، مثل الاشت قاق والمضاعف قد ارتبطت بكل عنصرفي القائمة.توضح المقالة اختيار العناصر التوضيحي اليدوي ومبادئ التوضيحية، والتقارير المتعلقة بموثوقية التوضيحية اليدوية، ويعرض الأدوات والموارد وبعض الإحصاءات الأولى.بالنظر إلى طبيعة الموارد الخاصة بالموارد، من الممكن استخدامه للدراسات التجريبية وكذلك تطوير خوارزميات مدركة في مجال اللغويسيا تجزئة مورفيم ووضع العلامات (نهج الكلمات الفرعية الإحصائية CF).سيتم توفير المورد بحرية متاحة.
يمكن أن تساعد ردود الفعل التصحيحية التلقائية التلقائي على تعلم اللغة من خلفيات مختلفة اكتساب لغة جديدة بشكل أفضل.تقدم هذه الورقة مجموعة بيانات متعلمة باللغة الإنجليزية التي يرافقها أخطاء المتعلمين معلومات حول مصادر الأخطاء المحتملة.تحتوي مجموعة البيا نات هذه على خطأ مشروح يدويا أسباب أخطاء كتابة المتعلم.هذه تسبب ربط أخطاء المتعلم بالهياكل من لغاتهم الأولى، عندما تتباعد القواعد باللغة الإنجليزية وفي اللغة الأولى.ستمكن هذه البيانات البيانات الجديدة من استحواذ الباحثين الاستحواذين باللغة الثانية على تحليل كمية كبيرة من أخطاء المتعلمين المرتبطة بنقل اللغة من اللغة الأولى من المتعلمين.يمكن أيضا تطبيق DataSet أيضا في تخصيص أنظمة تصحيح الأخطاء النحوية وفقا للغة الأولى للمتعلمين وفي تقديم ملاحظات مستنيرة عن طريق الخطأ.
تشبه مهمة تبسيط نص الوثيقة على مستوى المستندات إلى صعوبة تقليل التعقيد الإضافي.نقدم مجموعة بيانات مجمعة حديثا من النصوص الألمانية، التي تم جمعها من مجلة Swiss News 20 Minuten (20 دقيقة) والتي تتكون من مقالات كاملة مقررة مع ملخصات مبسطة.علاوة على ذلك، نقدم تجارب على تبسيط النص التلقائي مع MBART MBART متعددة اللغات المسبدة مسبقا ونسخة معدلة منها أكثر صديقة للذاكرة، باستخدام كل من مجموعة البيانات الجديدة والتبسيط الموجودة Corpora.تتيح لنا تعديلات MBArt التدريب بتكلفة أقل في الذاكرة دون فقدان الكثير من الخسارة في الأداء، في الواقع، فإن MBART أصغر يحسن حتى النموذج القياسي في إعداد مع مستويات تبسيط متعددة.
تتطلب العديد من التطبيقات توليد ملخصات مصممة خصيصا لاحتياجات معلومات المستخدم، أي نواياها. الأساليب التي تعبر عن النية عبر استعلامات المستخدم الصريحة تسقط قصيرة عند التفسير الاستعلام هو شخصي. توجد عدة مجموعات من مجموعات البيانات للتخصيص مع النوايا ال موضوعية حيث، لكل وثيقة ونوايا (E.G.، Weather ")، تكفي موجز واحد لجميع المستخدمين. لا توجد مجموعات البيانات، ومع ذلك، بالنسبة للمؤلفة الذاتية (E.G.، الأماكن المثيرة للاهتمام ") حيث سيقدم المستخدمون المختلفون ملخصات مختلفة. نحن نقدم العانة، أول مجموعة البيانات لتقييم أنظمة استخراج الملخص الذاتي. تحتوي STALUME على ثلاثة أفراد (وثيقة، نية، ملخص) ثلاثة توائم أكثر من 48 صفحة ويكيبيديا، مع عشرة نوبة ذاتي اختلاف ذاتي، والتي توفرها 103 فردا على الترك الميكانيكي. نوضح إحصائيا أن النوايا في SARMENT تختلف بشكل منهجي في الذاتية. للإشارة إلى فائدة SUTTUME، نستكشف مجموعة من خوارزميات أساسية لتلخيص استخراجي ذاتي وإظهار أن (I) كما هو متوقع، فإن النهج القائمة على سبيل المثال، من الأفضل أن تلتقط النوايا ذاتية من تلك القائمة على الاستعلام، و (2) هناك نطاق واسع لتحسينه خوارزميات الأساس، وبالتالي تحفز المزيد من الأبحاث حول هذه المشكلة الصعبة.
مع استمرار العالم في محاربة جائحة CovID-19، فإنه يقاتل في وقت واحد من نقص الدم "- وهو طوفان من تضليل وانتشار نظريات المؤامرة المؤدية إلى تهديدات صحية وشعبة المجتمع. لمكافحة هذا المعكرية، هناك حاجة ملحة لمجموعات البيانات القياسية التي يمكن أن تساعد ال باحثين على تطوير وتقييم النماذج الموجهة نحو الكشف التلقائي عن التضليل. في حين أن هناك جهودا متزايدة لإنشاء مجموعات بيانات قياسية كافية ومفتوحة للمصدر للغة الإنجليزية، فإن الموارد القابلة للمقارنة غير متاحة تقريبا بالنسبة للألمانية، مما يترك البحث في اللغة الألمانية متخلفة بشكل كبير. في هذه الورقة، نقدم DataSet المعيار الجديد Fang-Covid يتكون من 28،056 مواد إخبارية ألمانية حقيقية و 13،186 مرتبطة بمعائق CovID-19 وكذلك بيانات عن انتشارها على Twitter. علاوة على ذلك، نقترح نموذجا قابل للتفسير القائم على السياق والاجتماعي للكشف عن الأخبار المزيفة، ومقارنة أدائه إلى النماذج والأداء الأسود الميزة لتقييم الأهمية النسبية للميزات القابلة للتفسير البشرية في التمييز بين الأخبار المزيفة من الأخبار الأصلية وبعد

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا