ترغب بنشر مسار تعليمي؟ اضغط هنا

واحد: نحو نموذج واحد، خوارزمية واحدة، كوربوس واحدة مخصصة لتحليل المعنويات العربية / العربية ولهجتها

ONE: Toward ONE model, ONE algorithm, ONE corpus dedicated to sentiment analysis of Arabic/Arabizi and its dialects

192   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

اللغة العربية هي اللغة الرسمية البالغ 22 دولة، تحدث بأكثر من 400 مليون متحدث.تستخدم كل واحد من هذا البلد على الأقل لهجة محادثة الحياة اليومية.ثم، العربية لديها 22 لهجة على الأقل.يمكن كتابة كل لهجة في البرامج النصية العربية أو العربية.تركز أحدث الأبحاث على بناء نموذج لغة وجزعة تدريب لكل لهجة، في كل برنامج نصي.بعد هذه التقنية تعني إنشاء 46 موارد مختلفة (بما في ذلك اللغة العربية القياسية الحديثة، MSA) للتعامل مع لغة واحدة فقط.في هذه الورقة، استخرفنا مجموعة واحدة، ونقترح خوارزمية واحدة لإنشاء كائن تدريب واحد تلقائيا باستخدام بنية نموذج تصنيف واحد لتحليل المعنويات MSA ولهجات مختلفة.بعد مراجعة كوربوس التدريب يدويا، تتفوق النتائج التي تم الحصول عليها جميع نتائج الأدب البحثية ل Test Test Corpora.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

التراجع السريع للشبكات الاجتماعية عبر الإنترنت مثل YouTube، Facebook، Twitter يسمح للناس بالتعبير عن آرائهم على نطاق واسع على الإنترنت.ومع ذلك، في الوقت نفسه، يمكن أن يؤدي إلى زيادة في الصراع والكراهية بين المستهلكين في شكل حرية خطاب.لذلك، من الضروري اتخاذ طريقة تقوية إيجابية للبحث عن مشجعة، إيجابية، مساعدة، ومحتوى وسائل الإعلام الاجتماعية الداعمة.في هذه الورقة، نحن تصف نموذج برت محول من أجل الكشف عن الكلام عن الأمل للوصول والتنوع والاندماج، المقدمة لمهمة LT-ADI-2021 2. يحقق نموذجنا مرجحا معدل F1 مرجح من 0.93 على مجموعة الاختبار.
في هذه الورقة، نقدم تفاصيل النظم التي قدمناها مقابل WAT 2021 Multiindicmt: مهمة متعددة اللغات.لقد قدمنا نماذج NMT متعددة اللغات منفصلة: واحد للغة الإنجليزية إلى 10 لغات ind وآخر ل 10 لغات ind للغة الإنجليزية.نناقش تفاصيل تنفيذ نهجين منفصلين متعدد الل غات NMT، وهما واحدا وكثير من الأحيان والعديد من إلى واحد، والذي يستفيد من وحدة فك ترميز مشتركة ومشمير مشترك، على التوالي.من تجاربنا، نلاحظ أن أنظمة NMT متعددة اللغات تتفوق على أنظمة طيران الأساس ثنائية اللغة لكل من أزواج اللغة قيد الدراسة.
تشكل بروز أجهزة اللغة التصويرية، مثل السخرية والمفارقة، تحديات خطيرة لتحليل المعنويات العربية (SA).في حين أن أعمال البحث السابقة تعامل معها واكتشاف السخرية بشكل منفصل، تقدم هذه الورقة نموذجا للتعلم العميق المتعدد للمكملات المتعددة الإنهائية (MTL)، مم ا يتيح تفاعل المعرفة بين المهامتين.تتكون بنية MTL Model الخاصة بنا من تمثيل ترميز ثنائي الاتجاه من طراز المحولات (Bert)، وحدة تفاعل انتباه متعددة المهام، واثنين من مصنفين المهامين.تظهر النتائج الإجمالية التي تم الحصول عليها أن نموذجنا المقترح تتفوق على نظرائه المهمة الواحدة و MTL على كل من المهاجمة والشعور الفرعي للكشف عن المعنويات.
كما ينمو الإنترنت في الحجم، فهذا يفعل مقدار المعلومات القائمة على النص الموجود.بالنسبة للعديد من المساحات التطبيق، فإن الأمر أساسي لعزل وتحديد النصوص التي تتعلق بموضوع معين.في حين أن التصنيف من الفئة من الفئة سيكون مثاليا لهذه التحليل، فهناك نقص قريب في البحث فيما يتعلق بالنهج الفعالة مع قوة تنبؤية عالية.من خلال الإشارة إلى أن مجموعة المستندات التي يرغبنا في تحديدها كمجموعات خطية إيجابية لنموذج مساحة المتجهات التي تمثل نصنا، نقترح تصنيف مخروطي، وهو نهج يسمح لنا بتحديد ما إذا كان المستند من موضوع معين في حسابيبطريقة فعالة.نقترح أيضا استبعاد طبيعي، نسخة معدلة من الفصل العادي الذي يجعله أكثر ملاءمة في سياق التصنيف من فئتين.نظهر في تحليلنا أن نهجنا ليس لديه فقط قوة تنبؤية فقط على مجموعات البيانات الخاصة بنا، ولكنه أسرع أيضا في حسابه.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا