ترغب بنشر مسار تعليمي؟ اضغط هنا

اختيار المفردات المفروضة في اللعبة عبر قيمة shemley وفهرس البنزاف

Game-theoretic Vocabulary Selection via the Shapley Value and Banzhaf Index

289   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المفردات المدخلات والتمثيلات المستفادة أمر حاسم لأداء نماذج NLP العصبية. يؤدي استخدام نتائج المفردات الكاملة إلى نماذج أقل وتفسير الذاكرة، مع طبقة التضمين غالبا ما تشكل غالبية المعلمات النموذجية. من الشائع، من الشائع استخدام مفردات أصغر لخفض متطلبات الذاكرة وبناء المزيد من النماذج الأربعة. نقترح طريقة اختيار المفردات التي تعرض الكلمات كأعضاء في فريق يحاول زيادة أداء النموذج إلى الحد الأقصى. نحن نطبق مؤشرات الطاقة من نظرية الألعاب التعاونية، بما في ذلك فهرس قيمة Shemley و Banzhaf، والتي تقيس الأهمية النسبية لأعضاء الفريق الفردي في إنجاز مهمة مشتركة. نحسب تقريبا هذه المؤشرات لتحديد الكلمات الأكثر نفوذا. يفحص تقييم التجريبي الخاص بنا مهام متعددة الوزراء، بما في ذلك الجملة والتصنيف المستندات، والرد على السؤال والتتبع النصي. نقارن مع خطوط الأساسيات التي تختار الكلمات القائمة على ترددات التردد و TF-IDF والانحدار بموجب منتظم L1، وإظهار أن اختيار المفردات النظري للعبة هذه تفوق كل خط الأساس على مجموعة من المهام والعملات المختلفة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح مخطط تكييف المفردات المباشر لتوسيع نطاق القدرة اللغوية لنماذج الترجمة متعددة اللغات، مما يمهد الطريق نحو التعلم المستمر الفعال للترجمة الآلية متعددة اللغات.نهجنا مناسب لمجموعات البيانات واسعة النطاق، ينطبق على اللغات البعيدة مع البرامج النصية غ ير المرئية، وتحتل التدهور البسيط فقط على أداء الترجمة لأزواج اللغة الأصلية ويوفر أداء تنافسي حتى في الحالة التي نمتلك فيها بيانات أحادية الألوان فقط للغات الجديدة.
ندرس مشكلة توليد نص موادي لتصنيف كوسيلة لفهم وتصحيح التصحيح. بالنظر إلى إدخال نصي ونموذج تصنيف، نهدف إلى تغيير النص الصغير لتغيير تنبؤ النموذج. تم تطبيق نهج الصندوق الأبيض بنجاح على مشاكل مماثلة في الرؤية حيث يمكن للمرء تحسين المدخلات المستمرة مباشرة . تصبح النهج القائمة على التحسين صعبة في مجال اللغة بسبب الطبيعة المنفصلة للنص. نحن نتجاوز هذه المشكلة من خلال تحسين مباشرة في المساحة الكامنة والاستفادة من نموذج لغة لإنشاء تعديلات مرشحة من تمثيلات كامنة محسنة. نحن بالإضافة إلى استخدام قيم SHOPLEY لتقدير تأثير COMPINATIC من التغييرات المتعددة. ثم نستخدم هذه التقديرات لتوجيه بحث الشعاع عن النص النهائي العالمي. نحن نحقق أداء مواتية مقارنة بالبضعة البيضاء الحديثة والسود الأسود باستخدام التقييمات البشرية والآلية. تشير دراسات الاجتثاث إلى أن كل من الأمثل الكامنة واستخدام قيم shabley يحسن معدل النجاح ونوعية الوسائل المتعددة الناتجة.
حققت المحولات التي تم تدريبها مسبقا على شركة متعددة اللغات، مثل MBERT و XLM-ROBERTA، قدرات نقل متبقية مثيرة للإعجاب. في إعداد نقل الطلقة الصفرية، يتم استخدام بيانات التدريب الإنجليزية فقط، ويتم تقييم النموذج الدقيق على لغة مستهدفة أخرى. على الرغم من أن هذا يعمل بشكل جيد بشكل مدهش، فقد تمت ملاحظة تباين كبير في الأداء اللغوي المستهدف بين مختلف عمليات التشغيل الدقيقة، وفي إعداد الطلقة الصفرية، لا توجد بيانات تطوير اللغة المستهدفة متاحة للتحديد بين نماذج متعددة ذات الضبط. اعتمد العمل المسبق على بيانات Dev الإنجليزية لتحديد بين النماذج التي تم ضبطها بشكل جيد مع معدلات التعلم المختلفة وعدد الخطوات وغيرها من أنواع التشعبات، والتي غالبا ما تؤدي إلى اختيارات فرعية نفسها. في هذه الورقة، نوضح أنه من الممكن تحديد نماذج أفضل باستمرار عند توفر كميات صغيرة من البيانات المشروحة بلغات محورية إضافية. نقترح نهجا للتعلم الآلي للاختيار النموذجي الذي يستخدم التمثيلات الداخلية للأنظمة ذات الطراز الدقيق للتنبؤ بقدراتها المتبادلة. في تجارب شاملة، نجد أن هذه الطريقة تختار باستمرار نماذج أفضل من بيانات التحقق من صحة اللغة الإنجليزية عبر عشرين لغة (بما في ذلك 8 لغات منخفضة الموارد)، وغالبا ما تحقق النتائج التي تتميز باختيار نموذج باستخدام بيانات تطوير اللغة المستهدفة.
الهدف من التنبؤ بمفردات المخزون هو التنبؤ بمفردات متعلم كله بناء على عينة محدودة من كلمات الاستعلام.تقترب هذه الورقة عن المشكلة بدءا من نموذج نظرية استجابة البند 2-المعلمة (IRT)، مما يمنح كل كلمة في المفردات معلمة صعوبة والتمييز.يتم تقييم المعلمة الت مييز على مشكلة اختيار البند المسئولية الفرعية، مألوفة من مجالات الاختبار التكيفي المحوسب (القط) والتعلم النشط.بعد ذلك، يتم فحص تأثير المعلمة التمييز على أداء التنبؤ، سواء في إعداد تصنيف ثنائي، وفي بيئة استرجاع المعلومات.يتم مقارنة الأداء مع خط الأساس بناء على تردد Word.يتم فحص عدد من سيناريوهات التعميم المختلفة، بما في ذلك صعوبة الكلمة المعممة والتمييز باستخدام Adgeddings Word مع شبكة مؤشر واختبار بيانات خارج مجموعة البيانات.
توفر الشبكات العصبية القائمة على المحولات أداء تصنيف جيد للغاية عبر مجموعة واسعة من المجالات، لكن لا تقدم تفسيرات توقعاتها.في حين أن العديد من طرق التفسير، بما في ذلك الشكل، فإن معالجة مشكلة تفسير نماذج التعلم العميق، لا تتكيف معها للعمل على الشبكات العصبية القائمة على أحدث الأحوال مثل بيرت.مقرر آخر لهذه الطرق هو أن تصور التفسيرات الخاصة بهم في شكل قوائم من الكلمات الأكثر صلة لا يأخذ في الاعتبار الطبيعة المتسلسلة والهيكلية للنص.تقترح هذه الورقة طريقة TransShap التي تتكيف مع النماذج المحول بما في ذلك مصنفات النص المستند إلى BERT.تتقدم تصورات الشكل من خلال إظهار التفسيرات بطريقة متتالية، وتقييمها من قبل المقيمين البشري كمنافسة للحلول الحديثة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا