ترغب بنشر مسار تعليمي؟ اضغط هنا

تجارب تفاصيل الورقة هذه التي أجريناها في التبعيات العالمية 2.7 كورسا من أجل التحقيق في أمر الكلمات المهيمنة في اللغات المتاحة.لهذا الغرض، استخدمنا أداة إعادة كتابة الرسم البياني، نمت، والتي سمحت لنا بتجاوز التعليقات التوضيحية السطح وتحديد الموضوعات ا لضمنية.قمنا أولا بقياس توزيع أوامر الكلمة الستة المختلفة (SVO، SOV، VSO، VOS، OVS، OSV) في كورسا والتحقيق فيها عندما كان هناك فرق كبير في Corga بلغة معينة.بعد ذلك، قارننا النتائج التي تم الحصول عليها مع المعلومات المقدمة في قاعدة بيانات Wals (مجفف ومشبيلماث، 2013) وفي (̈Ostling، 2015).أخيرا، درسنا تأثير استخدام أداة إعادة كتابة الرسم البياني لهذه المهمة.تتوفر الأدوات والموارد المستخدمة لهذا البحث بحرية.
في اللغة الرومانية، هناك بعض الموارد لفهم النص التلقائي، ولكن بالنسبة للكشف عن المشاعر، لا يوجد أساس معجم، لا يوجد شيء. لتغطية هذه الفجوة، استخراجت بيانات من Twitter وإنشاء بيانات DataSet الأولى التي تحتوي على تغريدات مشروحة مع خمسة أنواع من العواطف: الفرح والخوف والحزن والغضب والمحايد، بقصد استخدام مهام التعدين وتحليل الرأي. في هذه المقالة، نقدم بعض ميزات مجموعة بياناتنا الجديدة، وخلق معيارا لتحقيق أول نموذج لتعلم الآلات الإشراف للكشف عن المشاعر التلقائية في النصوص القصيرة الرومانية. نحقق في أداء أربع نماذج تعلم الآلة الكلاسيكية: بايس ساذجة متعددة الأثر، الانحدار اللوجستي، تصنيف ناقلات الدعم وتصنيف ناقلات الدعم الخطي. نحن نحقق أيضا في المزيد من الأساليب الحديثة مثل FastText، والتي تستخدم معلومات الكلمات الفرعية. أخيرا، نحن نغلق برت الرومانية لتصنيف النص وإظهار تجاربنا أن النموذج القائم على بيرت لديه أفضل أداء لمهمة الكشف عن العاطفة من التغريدات الرومانية. الكلمات المفتاحية: الكشف عن العاطفة، تويتر، الرومانية، التعلم الآلي الإشراف
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا