ترغب بنشر مسار تعليمي؟ اضغط هنا

تكبير البيانات المحفوظة للدلالات لتحليل المعنويات المستندة إلى الجانب

Semantics-Preserved Data Augmentation for Aspect-Based Sentiment Analysis

336   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

كل من قضايا أوجه القصور في البيانات والاتساق الدلالي مهم لتعزيز البيانات.معظم الطرق السابقة تعالج القضية الأولى، ولكن تجاهل المرحلة الثانية.في حالات تحليل المعنويات المستندة إلى جانب الجسيم، قد يغير انتهاك القضايا المذكورة أعلاه قطبية الجانب والمشاعر.في هذه الورقة، نقترح نهج تكبير بيانات الحفاظ على دلالات - من خلال النظر في أهمية كل كلمة في تسلسل نصي وفقا للجوانب والمشاعر ذات الصلة.ثم نحل محل الرموز غير المهتمات مع استراتيجيتين استبدال دون تغيير قطبية مستوى الجانب.يتم تقييم نهجنا على العديد من مجموعات بيانات تحليل المعنويات المتاحة للجمهور وسيناريوهات التنبؤ في مجال الأسهم / المخاطر في العالم الحقيقي.تظهر النتائج التجريبية أن منهجيةنا تحقق أداء أفضل في جميع مجموعات البيانات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

ينطوي تحليل المعنويات المستندة إلى جانب الجسیلاء بشكل أساسي على ثلاث مجموعات فرعية: استخراج الأجل في الجانب، واستخراج الأجل رأي، وتصنيف المعنويات على مستوى الجانب، والذي يتم التعامل معه عادة بطريقة منفصلة أو مشتركة. ومع ذلك، فإن النهج السابقة لا تستغ ل العلاقات التفاعلية بين ثلاث مجموعات فرعية ولا تستفيد بشكل متفيد على مستوى الوثيقة / المعروفة المسمى المسمى المستندات المتوفرة بسهولة، مما يقيد أدائه. لمعالجة هذه المشكلات، نقترح شبكة نقل المعرفة متعددة المعرفة متعددة الرواية (IMKTN) ل AND-LITE ABSA. لشيء واحد، من خلال الارتباطات التفاعلية بين المهن الفرعية ABASA، تقوم IMKTN بتحويل المعرفة الخاصة بمهام المهام من أي اثنين من المهام الفرعية الثلاثة إلى واحدة أخرى على مستوى الرمز المميز من خلال الاستفادة من خوارزمية التوجيه المصممة جيدا، أي أي اثنين من سيساعد المهن الفرعية الثلاثة الثالث. بالنسبة لآخر، تقوم IMKTN بتحويل المعرفة على مستوى المستند، I.E.، المعرفة ذات الصلة بالمجال والمعنويات، إلى التسكال الفرعية على مستوى الجانب لتعزيز الأداء المقابل. النتائج التجريبية على ثلاثة مجموعات بيانات معيار توضح فعالية وتفوق نهجنا.
يركز تحليل المعنويات المستندة إلى جانب جوانب (ABASA) عادة على استخراج الجوانب والتنبؤ بمشاعرهم على جمل فردية مثل مراجعات العملاء. في الآونة الأخيرة، تلقت منصة أخرى من برنامج تقاسم الرأي، وهي منتدى الإجابة على السؤال (QA)، شعبية متزايدة، التي تتراكم ع دد كبير من آراء المستخدم تجاه الجوانب المختلفة. هذا يحفزنا على التحقيق في مهمة ABASA على منتديات ضمان الجودة (ABASA-QA)، تهدف إلى الكشف بشكل مشترك بين الجوانب التي تمت مناقشتها وأسطابات المشاعر الخاصة بهم لفترة من ضمان الجودة. على عكس جمل المراجعة، يتكون زوج ضمان الجودة من جملتين موازيتين، مما يتطلب نمذجة التفاعل لمحاذاة الجانب المذكور في السؤال وأدائن الرأي المرتبط في الإجابة. تحقيقا لهذه الغاية، نقترح نموذجا بتصميم محدد للنمذجة المتعلقة بالتفاعل عن الجوانب عبر الجملة لمعالجة هذه المهمة. يتم تقييم الطريقة المقترحة على ثلاثة مجموعات بيانات حقيقية، وتظهرت النتائج أن نموذجنا يفوق على العديد من خطوط الأساس القوية المعتمدة من النماذج الحكومية ذات الصلة.
يتنبأ تحليل المعنويات المستندة إلى جانب الجسيم (ABASA) بقبولية المعنويات نحو مصطلح معين معين في جملة، وهي مهمة مهمة في تطبيقات العالم الحقيقي. لأداء ABSA، يلزم النموذج المدرب أن يكون له فهم جيد للمعلومات السياقية، وخاصة الأنماط الخاصة التي تشير إلى ق طبية المعنويات. ومع ذلك، تختلف هذه الأنماط عادة في جمل مختلفة، خاصة عندما تأتي الجمل من مصادر مختلفة (المجالات)، مما يجعل ABSA لا يزال صعبا للغاية. على الرغم من الجمع بين البيانات المسمى عبر مصادر مختلفة (المجالات) هو حل واعد لمعالجة التحدي، في التطبيقات العملية، عادة ما يتم تخزين هذه البيانات المسمى في مواقع مختلفة وقد لا يمكن الوصول إليها لبعضها البعض بسبب الخصوصية أو المخاوف القانونية (مثل البيانات مملوكة لشركات مختلفة). لمعالجة هذه المشكلة واستخدم أفضل استخدام لجميع البيانات المسمى، نقترح نموذج ABSA الجديد مع التعلم الفيدرالي (FL) المعتمد للتغلب على قيود عزل البيانات وإدماج ذاكرة الموضوع (TM) المقترح اتخاذ حالات البيانات من مصادر متنوعة (المجالات) في الاعتبار. خاصة، تهدف TM إلى تحديد مصادر البيانات المختلفة المعزولة بسبب عدم إمكانية الوصول إلى البيانات من خلال توفير معلومات فئة مفيدة للتنبؤات المحلية. توضح النتائج التجريبية على بيئة محاكاة لثلاثة عقد مع ثلاث عقود فعالية نهجنا، حيث تتفوق TM-FL على خطوط أساس مختلفة بما في ذلك بعض أطر FL مصممة جيدا.
يعمل العمل الحديث على تصنيف المعنويات على مستوى جانب الجساب شبكات اتصالا بيانيا (GCN) على أشجار التبعية لتعلم التفاعلات بين شروط الارتفاع وكلمات الرأي. في بعض الحالات، لا يمكن الوصول إلى كلمات الرأي المقابلة لمصطلح الجانب داخل القفزتين على أشجار التب عية، والتي تتطلب المزيد من طبقات GCN إلى النموذج. ومع ذلك، غالبا ما تحقق GCNS أفضل أداء بطبقتين، ولا تحقق GCNs أعمق أي مكسب إضافي. لذلك، نقوم بتصميم نماذج GCN الانتباه الانتقائية الجديدة. من ناحية، يتيح النموذج المقترح التفاعل المباشر بين شروط الجانب وكلمات السياق عن طريق عملية الانتباه الذاتي دون تحديد المسافة على أشجار التبعية. من ناحية أخرى، تم تصميم إجراء اختيار Top-K لتحديد كلمات الرأي عن طريق تحديد كلمات سياق K مع أعلى درجات الاهتمام. نقوم بإجراء تجارب على عدة مجموعات بيانات معيار شائعة الاستخدام وتظهرت النتائج أن SA-GL-GCN المقترح تفوق نماذج أساسية قوية.
حقق نهج تكبير البيانات والضيقات الخصم مؤخرا نتائج واعدة في حل المشكلة المفرطة في العديد من مهام معالجة اللغة الطبيعية (NLP) بما في ذلك تصنيف المعنويات. ومع ذلك، فإن الدراسات الحالية التي تهدف إلى تحسين قدرة التعميم من خلال زيادة البيانات التدريبية مع أمثلة مرادفة أو إضافة ضوضاء عشوائية إلى Adgeddings Word، والتي لا يمكنها معالجة مشكلة الرابطة الزائفة. في هذا العمل، نقترح إطارا لتعزيز التعزيز نهاية إلى نهاية، والذي ينفذ بشكل مشترك توليد بيانات مضادة وتصنيف المعنويات المزدوجة. نهجنا لديه ثلاث خصائص: 1) يولد المولد تلقائيا جمل هائلة ومتنوعة؛ 2) يحتوي التمييز على مؤشر للمشاعر الجانبية الأصلية ومؤشر المعنويات الجانبية الناضجة، والذي يقوم بتقييم جودة العينة الناتجة بشكل مشترك ومساعدة المولد على توليد عينات مجفوف عالية الجودة أعلى جودة؛ 3) يتم استخدام التمييز مباشرة كقسم المعنويات النهائية دون الحاجة إلى بناء واحد إضافي. تظهر تجارب واسعة أن نهجنا يتفوق على خطوط خطوط خطوط تكبير البيانات قوية على العديد من مجموعات بيانات تصنيف المعفاة القياسية. يؤكد إجراء مزيد من التحليل بمزايا نهجنا في توليد عينات تدريب أكثر تنوعا وحل مشكلة الرابطة الزائفة في تصنيف المعنويات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا