ترغب بنشر مسار تعليمي؟ اضغط هنا

التعلم شبه الإشراف على أساس المعجم الذي تم إنشاؤه تلقائيا باستخدام XAI في تحليل المعنويات

Semi-Supervised Learning Based on Auto-generated Lexicon Using XAI in Sentiment Analysis

346   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الدراسة، اقترحنا طريقة وضع العلامات الزائفة القائمة على معجم الرواية باستخدام نهج AI (XAI) القائم. النهج الحالي لديه قيود أساسية في متواضتهم لأن المصنف الفقراء يؤدي إلى وضع علامة ناعمة غير دقيقة، ويؤدي إلى تصنيف الفقراء بشكل متكرر. وفي الوقت نفسه، نولد المعجم يتكون من كلمة المعنويات بناء على نقاط الشرح. ثم نحسب ثقة البيانات غير المسبقة مع المعجم وإضافتها إلى مجموعة بيانات المسمى لنهج وضع العلامات الزائفة القوية. لدينا طريقة المقترحة لها ثلاثة مساهمات. أولا، يولد المنهجية المقترحة تلقائيا معجما يعتمد على Xai ويقوم بإجراء وضع علامات زائفة مستقلة، وبالتالي ضمان الأداء الأعلى والأقلية مقارنة بالآخر. ثانيا، نظرا لأن وضع العلامات الزائفة القائمة على المعجم يتم تنفيذها دون التعلم في معظم النماذج، فإن كفاءة الوقت قد زادت إلى حد كبير، وثالثا، يمكن أن تكون المعجم المنتج عالية الجودة المتوفرة لتحليل المعنويات للبيانات من مجالات مماثلة. تم التحقق من فعالية وكفاءة أسلوبنا المقترح من خلال المقارنة الكمية مع طريقة وضع العلامات الزائفة الحالية والمراجعة النوعية للمعجم الذي تم إنشاؤه.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تهدف إلى توليد معجم البذور للاستخدام في مهام اللغة الطبيعية المصب والأساليب غير الخاضعة للرقابة لتحريض المعجم الثنائي اللغة قد حصلت على الكثير من الاهتمام في الأدبيات الأكاديمية مؤخرا. في حين أن الإعدادات المثيرة للاهتمام وغير المدمرة بالكامل غير واق عية؛ عادة ما تكون كميات صغيرة من البيانات ثنائية اللغة متاحة عادة بسبب وجود كوربوريل متوازي متعدد اللغات بشكل كبير، يمكن أن يخلق اللغويين كميات صغيرة من البيانات الموازية. في هذا العمل، نوضح نهجا فعالا من Bootstrapping لتعريفات المعجم الثنائية الشرفية شبه الإشراف التي تتمتع بنقاط القوة التكميلية لطريقين متباينين ​​لتحقيق المعجم الثنائي اللغة. في حين أن الطرق الإحصائية فعالة للغاية في حث أزواج الترجمة الصحيحة للكلمات التي تحدث في كثير من الأحيان في كوربوس موازية ومساحات تضمين أحادية مونولينغ لديها ميزة تم تدريبها على كميات كبيرة من البيانات، وبالتالي قد تحفز ترجمات دقيقة للكلمات غائبة عن الكائنات الصغيرة. من خلال الجمع بين هذه القوة النسبية وطريقتنا تحقق نتائج أحدث من الفن في 3 من 4 أزواج لغة في مجموعة اختبار VECMAP الصعبة التي تستخدم الحد الأدنى من الكميات من البيانات الموازية ودون الحاجة إلى قاموس الترجمة. نطلق تنفيذنا على www.blind-review.code.
تحليل مورفولوجي (MA) والتطبيع المعجمي (LN) هي مهام مهمة للنص الياباني الذي تم إنشاؤه بواسطة المستخدمين (UGT).لتقييم ومقارنة أنظمة MA / LN المختلفة، قمنا ببناء كوربوس UGT اليابانية المتاحة للجمهور.يشتمل كوربوس لدينا على 929 جمل مشروحة مع معلومات مورفو لوجية وتطبيعا، إلى جانب معلومات الفئة المصنفة لظواهر خاصة بوحشية UGT.أظهرت التجارب على الجثة أداء أداء منخفضة من أساليب MA / LN الحالية للكلمات غير العامة والنماذج غير القياسية، مما يشير إلى أن الكائن ستكون معيارا صعبا لمزيد من البحث حول UGT.
تقدم هذه الورقة خط أنابيب التعلم شبه الإشرافه (SSL) على أساس إطار المعلم الطالب، الذي يزداد ملايين الأمثلة غير المستمرة لتحسين مهام فهم اللغة الطبيعية (NLU). نحن نبحث في سؤالين يتعلق باستخدام البيانات غير المسبقة في سياق الإنتاج SSL: 1) كيفية تحديد ع ينات من تجمع بيانات ضخمة غير مسفوقة مفيدة لتدريب SSL، و 2) كيف تؤثر البيانات المحددة على أداء حالة مختلفة من بين تقنيات SSL-Art. نقارن أربعة تقنيات SSL المستخدمة على نطاق واسع، والتسمية الزائفة (PL)، وقطاع المعرفة (KD)، والتدريب الخصم الافتراضي (VAT) والتدريب عبر الرؤية (CVT) جنبا إلى جنب مع طريقتين اختيار البيانات بما في ذلك الاختيار القائم على اللجنة وتحسين الأسفل اختيار مقرها. نحن ندرس مزيدا من فوائد وعيوب هذه التقنيات عند تطبيقها على تصنيف تكاليف النية (IC) ومهام التعرف على الكيان المسماة (NER)، وتوفير المبادئ التوجيهية التي تحدد عندما تكون كل من هذه الطرق مفيدة لتحسين أنظمة NLU كبيرة الحجم.
في الآونة الأخيرة، يركز غالبية الباحثين تحليل المعنويات على تحليل المعنويات المستندة إلى الهدف لأنه يوفر تحليلا متعمقا بنتائج أكثر دقة بالمقارنة مع تحليل المعنويات التقليدية.في هذه الورقة، نقترح نهجا تعليميا تفاعليا لمعالجة مهمة تحليل المعنويات المست ندة إلى الهدف للغة العربية.يستخدم نموذج IA-LSTM المقترح آلية تفاعلية تعتمد على الانتباه لإجبار النموذج على التركيز على أجزاء مختلفة (أهداف) من الجملة.نحن نبحث في القدرة على استخدام الأهداف والحق الأيمن والأيسر، ونموذجها بشكل منفصل لتعلم تمثيلاتهم الخاصة عبر النمذجة التفاعلية.قمنا بتقييم نموذجنا على مجموعة بيانات مختلفة: مراجعة الفنادق العربية ومجموعات بيانات مراجعة الكتاب العربية.توضح النتائج فعالية استخدام هذه التقنية النمذجة التفاعلية للمهمة القائمة على الأهداف العربية.حصلت النموذج على قيم دقة 83.10 مقارنة بنماذج Sota مثل AB-LSTM-PC والتي حصلت على 82.60 لنفس مجموعة البيانات.
عندما نهم مهتمين في مجال معين، يمكننا جمع وتحليل البيانات من الإنترنت.لا يتم تصميم البيانات التي تم جمعها حديثا، لذلك من المأمول استخدام البيانات المسمى مفيدة للبيانات الجديدة.نقوم بإجراء التعرف على كيان الاسم (NER) وتحليل المعرفات المستندة إلى جانب الجسيم (ABASA) في التعلم متعدد المهام، والجمع بين شبكة توليد المعلمة والهندسة المعمارية Dann لبناء النموذج.في مهمة NER، يتم تصنيف البيانات مع التعادل والكسر، ويتم ضبط وزن المهمة وفقا لمعدل تغيير الخسارة في كل مهمة باستخدام متوسط الوزن الديناميكي (DWA).استخدمت هذه الدراسة مجموعات بيانات مجال مصدر مختلفة.تظهر النتائج التجريبية أن التعادل، استراحة يمكن أن تحسن نتائج النموذج؛يمكن أن يكون DWA أداء أفضل في النتائج؛يمكن استخدام مزيج شبكة توليد المعلمة وطبقة انعكاس التدرج لكل تعلم جيد في مجال مختلف.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا