ترغب بنشر مسار تعليمي؟ اضغط هنا

مكنت الوصول الواسع من منصات وسائل التواصل الاجتماعي، مثل Twitter، العديد من المستخدمين من مشاركة أفكارهم وآرائهم وعواطفهم على مواضيع مختلفة عبر الإنترنت. سيسمح القدرة على الكشف عن هذه المشاعر تلقائيا العلماء الاجتماعيين، وكذلك الشركات التي يجب فهم ال ردود بشكل أفضل من الأمم والأزياء. في هذه الدراسة، نقدم مجموعة بيانات تتراوح بين 30،000 تغريدات فارسي تحمل مشاعر EKMAN الأساسية الستة (الغضب والخوف والسعادة والحزن والحزن والكراهية والعجب). هذه هي أول مجموعة بيانات العاطفة المتاحة للجمهور في اللغة الفارسية. في هذه الورقة، نوضح نظام جمع البيانات ووضع العلامات المستخدمة لإنشاء هذه البيانات. نقوم أيضا بتحليل مجموعة البيانات التي تم إنشاؤها، والتي تظهر ميزات وخصائص البيانات المختلفة. من بين أشياء أخرى، نحقق في حدوث مشاعر مختلفة في مجموعة البيانات، والعلاقة بين المعنويات والعاطفة الحالات النصية. تتوفر DataSet علنا ​​في https://github.com/nazaninsbr/persian-emotion-detection.
أصبح استخراج المعلومات من المستندات استخداما رائعا لمناطق معالجة اللغة الطبيعية الجديدة. معظم منهجيات استخراج الكيانات متغير في سياق مثل المنطقة الطبية، المنطقة المالية، كما تقتصر على اللغة المحددة. من الأفضل أن يكون لديك نهج عام واحد ينطبق على أي نو ع مستند لاستخراج معلومات الكيان بغض النظر عن اللغة والسياق والهيكل. أيضا، هناك مشكلة أخرى في هذا البحث تحليل هيكلي مع الحفاظ على ميزات التسلسل الهرمي والدلي والمثير. مشكلة أخرى تم تحديدها هي أنه عادة، فإنه يتطلب كوربا تدريب ضخما. لذلك، يركز هذا البحث على التخفيف من هذه الحواجز. تم تحديد العديد من النهج نحو بناء مستخرجات معلومات المستندات التي تركز على تخصصات مختلفة. تتضمن منطقة البحث هذه معالجة اللغة الطبيعية والتحليل الدلالي واستخراج المعلومات والنمذجة المفاهيمية. تقدم هذه الورقة مراجعة لآلية استخراج المعلومات لبناء إطار عام لاستخراج المستندات بهدف توفير قاعدة صلبة للبحث القادم.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا