ترغب بنشر مسار تعليمي؟ اضغط هنا

هل تامة بناء الجملة؟خط أساس قوي لتحليل المعنويات القائم على الجانب مع روبرتا

Does syntax matter? A strong baseline for Aspect-based Sentiment Analysis with RoBERTa

376   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تحليل المعنويات المستندة إلى جانب الجسيم (ABASA)، تهدف إلى التنبؤ بأقطاب الجوانب، هي مهمة جيدة المحبوس في مجال تحليل المعنويات. وأظهر العمل السابق معلومات النحوية، على سبيل المثال أشجار التبعية، يمكن أن تحسن بشكل فعال أداء ABSA. في الآونة الأخيرة، أظهرت النماذج المدربة مسبقا (PTMS) أيضا فعاليتها على ABAMA. لذلك، تنشأ السؤال بشكل طبيعي ما إذا كانت PTMs تحتوي على معلومات نصنية كافية ل ABAMA حتى نتمكن من الحصول على نموذج ABSA جيد فقط بناء على PTMS. في هذه الورقة، نقارن أولا الأشجار المستحثة من PTMS وأشجار تحليل التبعية في العديد من النماذج الشعبية لمهمة ABASA، والتي توضح أن الشجرة المستحقة من روبرتا الصعبة (FT-Roberta) تتفوق على الشجرة التي قدمتها المحلل المحاور. تكشف تجارب التحليل الإضافي أن شجرة FT-Roberta المستحقة أكثر من المعنويات - الموجهة إلى كلمة ويمكن أن تفيد مهمة ABASA. تشير التجارب أيضا إلى أن النموذج النقي المستند إلى روبرتا يمكن أن تفوق أو تقريب من عروض SOTA السابقة على ست مجموعات بيانات عبر أربع لغات لأنها تتضمن ضمنيا المعلومات الأساسية الموجهة نحو المهام.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

كل من قضايا أوجه القصور في البيانات والاتساق الدلالي مهم لتعزيز البيانات.معظم الطرق السابقة تعالج القضية الأولى، ولكن تجاهل المرحلة الثانية.في حالات تحليل المعنويات المستندة إلى جانب الجسيم، قد يغير انتهاك القضايا المذكورة أعلاه قطبية الجانب والمشاعر .في هذه الورقة، نقترح نهج تكبير بيانات الحفاظ على دلالات - من خلال النظر في أهمية كل كلمة في تسلسل نصي وفقا للجوانب والمشاعر ذات الصلة.ثم نحل محل الرموز غير المهتمات مع استراتيجيتين استبدال دون تغيير قطبية مستوى الجانب.يتم تقييم نهجنا على العديد من مجموعات بيانات تحليل المعنويات المتاحة للجمهور وسيناريوهات التنبؤ في مجال الأسهم / المخاطر في العالم الحقيقي.تظهر النتائج التجريبية أن منهجيةنا تحقق أداء أفضل في جميع مجموعات البيانات.
في تحليل التمثيل المعني المتبادل التجريدي (AMR)، يقوم الباحثون بتطوير النماذج التي تمارس طرزها من لغات مختلفة على الأمراض الأمريكية لالتقاط هياكلها الدلالية الأساسية: بالنظر إلى عقوبة بأي لغة، نهدف إلى التقاط المحتوى الدلالي الأساسي من خلال المفاهيم المتصلةأنواع متعددة من العلاقات الدلالية.الأساليب عادة ما تصل إلى بيانات التدريب الفضي الكبيرة لتعلم نموذج واحد قادر على مشروع الجمل غير الإنجليزية إلى AMRS.ومع ذلك، نجد أن خط الأساس البسيط يميل إلى التغاضي عنه: ترجمة الجمل إلى الإنجليزية وتستعرض AMR الخاص بهم مع محلل عمرو أحادي (ترجمة + تحليل، T + P).في هذه الورقة، نؤيد هذا الخط الأساسي البسيط من خطوتين، وتعزيزه بنظام NMT قوي ومحلل عمرو قوي.تظهر تجاربنا أن T + P يتفوق على نظام أحدث حديثة في جميع اللغات التي تم اختبارها: الألمانية والإيطالية والإسبانية وماندرين مع +14.6 و +12.6 و +14.3 ونقاط Smatch
ينطوي تحليل المعنويات المستندة إلى جانب الجسیلاء بشكل أساسي على ثلاث مجموعات فرعية: استخراج الأجل في الجانب، واستخراج الأجل رأي، وتصنيف المعنويات على مستوى الجانب، والذي يتم التعامل معه عادة بطريقة منفصلة أو مشتركة. ومع ذلك، فإن النهج السابقة لا تستغ ل العلاقات التفاعلية بين ثلاث مجموعات فرعية ولا تستفيد بشكل متفيد على مستوى الوثيقة / المعروفة المسمى المسمى المستندات المتوفرة بسهولة، مما يقيد أدائه. لمعالجة هذه المشكلات، نقترح شبكة نقل المعرفة متعددة المعرفة متعددة الرواية (IMKTN) ل AND-LITE ABSA. لشيء واحد، من خلال الارتباطات التفاعلية بين المهن الفرعية ABASA، تقوم IMKTN بتحويل المعرفة الخاصة بمهام المهام من أي اثنين من المهام الفرعية الثلاثة إلى واحدة أخرى على مستوى الرمز المميز من خلال الاستفادة من خوارزمية التوجيه المصممة جيدا، أي أي اثنين من سيساعد المهن الفرعية الثلاثة الثالث. بالنسبة لآخر، تقوم IMKTN بتحويل المعرفة على مستوى المستند، I.E.، المعرفة ذات الصلة بالمجال والمعنويات، إلى التسكال الفرعية على مستوى الجانب لتعزيز الأداء المقابل. النتائج التجريبية على ثلاثة مجموعات بيانات معيار توضح فعالية وتفوق نهجنا.
يركز تحليل المعنويات المستندة إلى جانب جوانب (ABASA) عادة على استخراج الجوانب والتنبؤ بمشاعرهم على جمل فردية مثل مراجعات العملاء. في الآونة الأخيرة، تلقت منصة أخرى من برنامج تقاسم الرأي، وهي منتدى الإجابة على السؤال (QA)، شعبية متزايدة، التي تتراكم ع دد كبير من آراء المستخدم تجاه الجوانب المختلفة. هذا يحفزنا على التحقيق في مهمة ABASA على منتديات ضمان الجودة (ABASA-QA)، تهدف إلى الكشف بشكل مشترك بين الجوانب التي تمت مناقشتها وأسطابات المشاعر الخاصة بهم لفترة من ضمان الجودة. على عكس جمل المراجعة، يتكون زوج ضمان الجودة من جملتين موازيتين، مما يتطلب نمذجة التفاعل لمحاذاة الجانب المذكور في السؤال وأدائن الرأي المرتبط في الإجابة. تحقيقا لهذه الغاية، نقترح نموذجا بتصميم محدد للنمذجة المتعلقة بالتفاعل عن الجوانب عبر الجملة لمعالجة هذه المهمة. يتم تقييم الطريقة المقترحة على ثلاثة مجموعات بيانات حقيقية، وتظهرت النتائج أن نموذجنا يفوق على العديد من خطوط الأساس القوية المعتمدة من النماذج الحكومية ذات الصلة.
يهدف تصنيف المعنويات على مستوى الجانب (ALSC) إلى تحديد قطبية المعنويات من جانب محدد في جملة. ESSC عبارة عن إعداد عملي في تحليل المعنويات المستندة إلى جانب الجسيم بسبب عدم وجود مصطلح الرأي اللازم، لكنه فشل في تفسير سبب اشتقاق قطبية المعنويات للجانب. ل معالجة هذه المشكلة، تعمل الأعمال الحديثة من تشفير المحولات التي تم تدريبها مسبقا على ELSC لاستخراج شجرة التبعية التي تركز على جانب جانب الجوانب التي يمكن أن تحدد كلمات الرأي. ومع ذلك، فإن كلمات الرأي المستحثة توفر فقط جديلة بديهية أقل بكثير من الترجمة الترجمة الشاملة على مستوى الإنسان. بالإضافة إلى ذلك، يميل التشفير المدرب مسبقا إلى استيعاب المشاعر الجوهرية في الجانب، مما تسبب في تحيز المعنويات وبالتالي يؤثر على أداء النموذج. في هذه الورقة، نقترح إطارا لتعليم تمثيل جانبي لمكافحة التحيز. يزيل أولا تحيز المعنويات في الجانب التضمين من خلال التعلم الخصم ضد المعنويات السابقة للجوانب. بعد ذلك، تقوم بمحاطة مرشحي الرأي المقطرين بالجانب من خلال نمذجة التبعية المستندة إلى SPAN لتسليط الضوء على شروط الرأي القابلة للتفسير. إن طريقتنا تحقق أداء جديد لحساب الفن في خمسة معايير، مع إمكانية استخراج الرأي غير المزعوم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا