ترغب بنشر مسار تعليمي؟ اضغط هنا

نحو مراجعة فائدة التفسيرات لتصحيح التصحيح النموذجي

Towards Benchmarking the Utility of Explanations for Model Debugging

427   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعد أساليب تفسير ما بعد الهوك فئة مهمة من الأساليب التي تساعد في فهم الأساس المنطقي وراء قرار النموذج المدربين.ولكن ما مدى فائدة المستخدمين النهائي نحو تحقيق مهمة معينة؟في هذه الورقة الرؤية، نقول الحاجة إلى معيار لتسهيل تقييمات فائدة أساليب تفسير ما بعد المخصص.كخطوة أولى لهذه الغاية، فإننا نعدد العقارات المرغوبة التي يجب أن تمتلكها مثل هذا المعيار لمهمة تصحيح التصحيح النصوص النصية.بالإضافة إلى ذلك، نسلط الضوء على أن هذا المعيار يسهل ليس فقط تقييم فعالية التفسيرات ولكن أيضا كفاءتها.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعتمد نماذج التعلم العميق الحديثة لمعالجة اللغة الطبيعية بشكل كبير على كميات كبيرة من النصوص المشروح.ومع ذلك، قد يكون الحصول على مثل هذه النصوص صعبة عندما تحتوي على معلومات شخصية أو سرية، على سبيل المثال، في المجالات الصحية أو القانونية.في هذا العمل، نقترح طريقة لإلغاء تحديد المستندات النصية النموذج الحرة من خلال تقسيم البيانات الحساسة بعناية فيها.نظهر أن طريقتنا تحافظ على الأداة المساعدة للبيانات لتصنيف النصوص ووضع التسلسل والتسجيل الإجابة على المهام.
منطق العموم الزمني هي مهمة صعبة لأنها تتطلب المعرفة الزمنية عادة غير صريحة في النص.في هذا العمل، نقترح نموذج فرقة لسبب المنظمات الزمنية.يعتمد نموذجنا على تمثيلات سياقية مدربة مسبقا من نماذج اللغة القائمة على المحولات (IE، Bert)، وعلى مجموعة متنوعة من طرق التدريب لتعزيز تعميم النموذج: 1) ضبط غرامة متعددة الخطوات باستخدام المهام العاطفية المحددة بعناية ومجموعات البيانات، و2) مهمة نموذجية مصممة مصممة خصيصا له مهمة تهدف إلى التقاط معرفة العمليات الزمنية.يتفوق نموذجنا إلى حد كبير على نهج ضبط الدقيقة القياسية والقواعد الأساسية القوية على DataSet MC-Taco.
توضيحات تناقض توضيح سبب حدوث حدث قد حدث على عكس آخر.إنهم بطبيعتهم بديهية للبشر لكل من الإنتاج والفهم.نقترح طريقة لإنتاج تفسيرات صغيرة في الفضاء الكامن، من خلال إسقاط تمثيل الإدخال، بحيث يتم التقاط الميزات التي تفرق إلا عن قرارات محتملة.يسمح التعديل ل دينا بسلوك نموذجي للنظر في التفكير المتعرج فقط، والكشف عن جوانب المدخلات مفيدة لقرارات ومعاكضة معينة.يمكن أن تجيب تفسيراتنا الصنع للإجابة على أي تسمية، ومعها الملصق البدائل، هي ميزة إدخال معينة مفيدة.نحن ننتج تفسيرات صغيرة عبر كل من إسناد مفهوم مجردة رفيع المستوى ومستوى المدخلات / المدخلات منخفضة المستوى لإسناد معايير تصنيف NLP.توضح نتائجنا قدرة التفسيرات على نطاق واسع لتوفير إمكانية الترجمة الترجمة الفورية للقرارات النموذجية.
يتم تدريب معظم نماذج تقدير الجودة الحالية (QE) للترجمة الآلية وتقييمها في بيئة إشراف بالكامل تتطلب كميات كبيرة من بيانات التدريب المسمى. ومع ذلك، يمكن أن تكون الحصول على البيانات المسمى باهظة الثمن وتستغرق وقتا طويلا. بالإضافة إلى ذلك، قد تتعرض بيانا ت الاختبار التي سيتم التعرض لها نموذج QE المنشور قد تختلف عن بيانات التدريب الخاصة بها بطرق مهمة. على وجه الخصوص، غالبا ما يتم تصنيف عينات التدريب من خلال مجموعة واحدة أو مجموعة صغيرة من المعلقين، والتي قد تختلف تصورات جودة الترجمة واحتياجاتها بشكل كبير من هؤلاء المستخدمين النهائيين، الذين سيعملون التنبؤات في الممارسة العملية. وبالتالي، من المرغوب فيه أن تكون قادرا على التكيف مع نماذج QE بكفاءة إلى بيانات المستخدم الجديدة مع بيانات الإشراف المحدودة. لمعالجة هذه التحديات، نقترح نهجا لتعليم التعلم بايزي لتكييف نماذج QE لاحتياجات وتفضيلات كل مستخدم مع إشراف محدود. لتعزيز الأداء، فإننا نقترح كذلك امتدادا إلى نهج التعلم التلوي بايز بين الفنادق التي تستخدم نواة مصفوفة ذات قيمة لتعلم التلوي بايزي لتقدير الجودة. توضح التجارب المعنية ببيانات عدد متفاوت من المستخدمين والخصائص اللغوية أن نهج التعلم التلوي المقترح يقدم أداء تنبؤي محسن في كل من إعدادات الإشراف المحدودة والكامل.
اجتذبت تحليل المعنويات الاهتمام المتزايد في التجارة الإلكترونية. تعتبر أسابير المشاعر الأساسيين لمراجعات المستخدمين ذات قيمة كبيرة لذكاء الأعمال. تحليل المعنويات الفئة في الأساس (ACSA) ومراجعة التنبؤ بالتصنيف (RP) هما مهامان أساسيان للكشف عن أسطاطات المشاعر الدقيقة إلى الخشنة. ترتبط ACSA و RP بشكل كبير وعادة ما تستخدم بشكل مشترك في سيناريوهات التجارة الإلكترونية في العالم الحقيقي. في حين يتم بناء معظم مجموعات البيانات العامة ل ACSA و RP بشكل منفصل، مما قد يحد من استغلالهما الإضافي لكلتا المهام. لمعالجة المشكلة والبحثات المتقدمة ذات الصلة، نقدم مراجعة مطعم صيني واسع النطاق في اسرع وقت ممكن في اسرع وقت ممكن في اسرع وقت ممكن 46، 730 مراجعات أصلية من نظام التجارة الإلكترونية الرائدة عبر الإنترنت (O2O) في الصين. إلى جانب تصنيف مقياس من 5 نجوم، يتم تفجيح كل مراجعة يدويا وفقا لأقطاب المعنويات نحو 18 فئة من الارتفاع المحدد مسبقا. نأمل أن يتم إلقاء الإفراج عن DataSet على إلقاء بعض الضوء على مجال تحليل المعنويات. علاوة على ذلك، نقترح نموذج مشترك بديهي ولكن فعال ل ACSA و RP. توضح النتائج التجريبية أن النموذج المشترك تفوق خطوط الأساس الحديثة في كلا المهام.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا