ترغب بنشر مسار تعليمي؟ اضغط هنا

الجمع بين تمثيلات خالية من السياق والسياق للكشف عن السخرية والمعنويات العربية

Combining Context-Free and Contextualized Representations for Arabic Sarcasm Detection and Sentiment Identification

535   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

منذ إنشائها، أدت نماذج اللغة القائمة على المحولات إلى مكاسب أداء مثيرة للإعجاب عبر مهام معالجة لغات طبيعية متعددة. بالنسبة للعربية، يتم تحقيق النتائج الحالية من أحدث البيانات في معظم مجموعات البيانات بواسطة نموذج اللغة العربية. على الرغم من هذه التطورات الحديثة، يستمر الكشف عن السخرية والشاحنات بمهام تحديا باللغة العربية، بالنظر إلى التشكل الغني باللغة والتفاوت اللغوي والاختلافات الجدلية. تقدم فريق Project Team Profers لفريق SPPU-AASM للمهمة المشتركة Wanlp Arsarcasm المشتركة 2021، والمراكز حول الكشف عن السخرية ومشاعر القطبية للعقائز العربية. تقترح الدراسة نموذجا مختلطا، يجمع بين تمثيلات الجملة من أرابيرت مع ناقلات كلمة ثابتة تدربت على شركة الوسائط الاجتماعية العربية. يحقق النظام المقترح درجة F1-Saarchastic من 0.62 ودرجة F-PN من 0.715 بمهام الكشف عن السخرية والشاحنات، على التوالي. تشير نتائج المحاكاة إلى أن النظام المقترح تتفوق على العديد من النهج الحالية لكل من المهام، مما يشير إلى أن دمج تمثيلات نصية خالية من السياق والسياق يمكن أن تساعد في التقاط جوانب تكميلية من معنى الكلمات باللغة العربية. احتل النظام المرتبة الثانية والعاشرة في المهام الفرعية ذات الصلة بتكشف السخرية وتحديد المعنويات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الكشف عن السخرية هو واحد من أفضل المهام الصعبة في تصنيف النص، لا سيما بالنسبة للغة العربية غير الرسمية بالغشاء النحوي والدلي العالي.نقترح أنظمتين تسخير المعرفة من مهام متعددة لتحسين أداء المصنف.تقدم هذه الورقة أنظمة المستخدمة في مشاركتنا إلى المهام ا لفرعية لورشة معالجة اللغات الطبيعية العربية السادسة (WANLP)؛تحليل السخرية وتحليل المعنويات.المنهجيات الخاصة بنا مدفوعة بفرضية أن التغريدات ذات الشعور السلبي والثغرات السلبية مع محتوى السخرية من غير المرجح أن يكون لها محتوى مسيء، وبالتالي، تؤدي إلى ضبط طراز التصنيف باستخدام كوربوس كبيرة من اللغة المسيئة، عملية التعلم للنموذج للكشف بشكل فعالالمعنويات ومحتويات السخرية.توضح النتائج فعالية نهجنا لمهمة الكشف عن السخرية على مهمة تحليل المعنويات.
تجذب تصنيف المعنويات والكشف عن السخرية الكثير من الاهتمام من قبل مجتمع البحوث NLP. ومع ذلك، فإن حل هاتين المشكلتين باللغة العربية وعلى أساس بيانات الشبكة الاجتماعية (I.E.، Twitter) لا يزال مصلحة أقل. في هذه الورقة نقدم حلولا مخصصة لتصنيف المعنويات وم هام الكشف عن السخرية التي تم تقديمها كجزء من مهمة مشتركة من قبل أبو فرحة وآخرون. (2021). نقوم بضبط نماذج المحولات الحالية المحولات الحالية لاحتياجاتنا. بالإضافة إلى ذلك، نستخدم مجموعة متنوعة من تقنيات التعلم الآلي مثل أخذ العينات الأولية والتكبير والتعبئة والتغليف واستخدام ميزات META لتحسين أداء النماذج. نحن نحقق درجة F1 من 0.75 على مشكلة تصنيف المعنويات حيث يتم حساب درجة F1 على الفصول الإيجابية والسلبية (لا يتم أخذ الفصل المحايد في الاعتبار). نحن نحقق درجة F1 من 0.66 فوق مشكلة الكشف عن السخرية حيث يتم حساب درجة F1 عبر الفئة الساخرة فقط. في كلتا الحالتين، يتم تقييم النتائج المذكورة أعلاه على Arsarcasm-V2 - مجموعة بيانات ممتدة من Arsarcasm (Farha و Magdy، 2020) تم تقديمها كجزء من المهمة المشتركة. هذا يعكس تحسنا لتحقيق أحدث النتائج في كلتا المهام.
تقدم هذه الورقة استراتيجيتنا لمعالجة المهمة المشتركة EACL WANLP-2021: السخرية والكشف عن المعنويات.يهدف أحد المهن الفرعية إلى تطوير نظام يحدد ما إذا كانت سقسقة عربية معينة ساخرة في الطبيعة أم لا، في حين أن الآخر يهدف إلى تحديد مشاعر سقسقة اللغة العربي ة.نحن نقترب من المهمة في خطوتين.تتضمن الخطوة الأولى مسبقا لمعلومات البيانات المقدمة من خلال إجراء الإدراج والحذف وعمليات التجزئة في أجزاء مختلفة من النص.تنطوي الخطوة الثانية على تجربة متغيرات متعددة من نماذج محولتين، Araelectra وعربت.تم تصنيف نهجنا النهائي في المرتبة السابعة والرابعة في المهاجمين والكشف عن المشاعر الفرعية على التوالي.
وصفنا نظامنا المقدم لهذه المهمة المشتركة 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية (أبو فرحة وآخرون، 2021).لقد تناولنا كل من المجموعات الفرعية، وهما اكتشاف السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).استخدمنا نماذج تمثيل نصية محكومة لل حالة من بين الفنون وتصنفها بشكل جيد وفقا لمهمة المصب في متناول اليد.كهدودي أول، استخدمنا بيرت متعددة اللغات من Google ثم المتغيرات العربية الأخرى: أرابيرت وأشرر وماربيرت.وجدت النتائج تظهر أن Marbert تفوقت على جميع النماذج المذكورة مسبقا بشكل عام، إما على التراكب الفرعي 1 أو Subtask 2.
الاكتشاف الساخرة ذات أهمية كبيرة في فهم المشاعر والآراء الحقيقية للناس.العديد من التقيمات عبر الإنترنت، مراجعات، تعليقات وسائل التواصل الاجتماعي، إلخ.لقد تم بالفعل إجراء العديد من الأبحاث بالفعل في هذا المجال، لكن معظم الباحثين درس تحليل الساركاز الإ نجليزي مقارنة بالبحثية تتم في تحليل السخرية العربية بسبب تحديات اللغة العربية.في هذه الورقة، نقترح نهجا جديدا لتحسين اكتشاف السخرية العربية.يتم استخدام نهجنا تكبير البيانات، وكلمة السياق، ونموذج الغابات العشوائية للحصول على أفضل النتائج.كانت دقةنا في المهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية 0.5189 ل F1-Saarcastic مثل المقياس الرسمي باستخدام DataSet Arsarcasmv2 المشترك (أبو فرحة، وآخرون، 2021).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا