ترغب بنشر مسار تعليمي؟ اضغط هنا

انها المنطقية، أليس كذلك؟إزالة الغموض التقييمات البشرية في نظم NLG المعززة في المنطقية

It's Commonsense, isn't it? Demystifying Human Evaluations in Commonsense-Enhanced NLG Systems

353   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الحس السليم هو جزء لا يتجزأ من الإدراك البشري الذي يسمح لنا بإجراء قرارات سليمة، والتواصل بفعالية مع الآخرين وتفسير المواقف والكلام. قد تساعدنا أنظمة AI مع إمكانيات المعرفة المنطقية على الاقتراب من إنشاء أنظمة تعرض ذكاء بشري. ركزت الجهود الأخيرة في توليد اللغة الطبيعية (NLG) على دمج معرفة المنظمات من خلال نماذج لغوية مدربة مسبقا واسعة النطاق أو بإدماج قواعد المعرفة الخارجية. تعرض هذه الأنظمة إمكانيات التفكير دون الشعور بالشمول المشفرة بشكل صريح في مجموعة التدريب. تتطلب هذه الأنظمة تقييم دقيق، حيث تقوم بدمج موارد إضافية أثناء التدريب التي تضيف مصادر إضافية للأخطاء. بالإضافة إلى ذلك، يمكن أن يكون للتقييم البشري لمثل هذه الأنظمة اختلافا كبيرا، مما يجعل من المستحيل مقارنة الأنظمة المختلفة وتحديد الأساس. تهدف هذه الورقة إلى إزالة الغموض عن التقييمات الإنسانية لأنظمة NLG المعززة بالعموم من خلال اقتراح بطاقة تقييم العمولة (CEC)، وهي مجموعة من توصيات تقارير التقييم لأنظمة NLG المعززة بالعموم، التي أجرتها تحليل شامل للتقييمات البشرية المبلغ عنها في الأدب الأخير وبعد



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

شهد حقل NLP مؤخرا زيادة كبيرة في العمل المتعلق بتكاثر النتائج، وأكثر اعترافا بشكل عام بأهمية وجود تعريفات وممارسات مشتركة تتعلق بالتقييم. وقد تركز الكثير من العمل على الاستيلاء على الدرجات المترية حتى الآن، مع استنساخ نتائج التقييم البشرية التي تتلقى اهتماما أقل بكثير. كجزء من برنامج بحثي مصمم لتطوير نظرية وممارسة تقييم استنساخ في NLP، نظمت المهمة المشتركة الأولى بشأن استنساخ التقييمات البشرية، وتوبيخ 2021. تصف هذه الورقة المهمة المشتركة بالتفصيل، تلخص النتائج من كل مجال من دراسات الاستنساخ قدمت، ويوفر المزيد من التحليل المقارن للنتائج. من بين تسع تسجيلات الفريق الأولية، تلقينا عروض من أربعة فرق. كشف التحليل التلوي لدراسات الاستنساخ الأربعة عن درجات متفاوتة من التكاثر، وسمحت باستنتاجات أولية مبدئية للغاية حول أنواع التقييم التي تميل إلى تحسين استنساخ أفضل.
الكشف عن السخري مهم بالنسبة للعديد من مهام NLP مثل تحديد المعنويات في مراجعات المنتج وملاحظات المستخدم والمنتديات عبر الإنترنت.إنها مهمة صعبة تتطلب فهم عميق للغة والسياق والمعرفة العالمية.في هذه الورقة، نحقق ما إذا كانت دمج المعرفة المنطقية تساعد في الكشف عن السخرية.بالنسبة لهذا، فإننا ندمج معارف المنطقية في عملية التنبؤ باستخدام شبكة استئصال الرسم البياني مع تضيير نموذج اللغة المدرب مسبقا كمدخلات.تشير تجاربنا المزودة بثلاث مجموعات بيانات للكشف عن السخرية إلى أن النهج لا يتفوق على النموذج الأساسي.نحن نقوم بإجراء مجموعة شاملة من التجارب لتحليل المكان الذي يضيف فيه دعم المنطقي قيمة وأين يضر التصنيف.ينطبق تنفيذنا علنا على: https://github.com/brcsomnath/commonseense-sarasmasr.
أظهرت نماذج واسعة النطاق على نطاق واسع عروضا قوية على العديد من توليد اللغة الطبيعية وفهم المعايير.ومع ذلك، فإن إدخال العمولة فيها لتوليد نص أكثر واقعية يظل تحديا.مستوحاة من العمل السابق على جيل المعرفة المنطقي ومنطق العموم التوليد، نقدم طريقتين لإضا فة مهارات ومعرفة المنطق المنطقي إلى نماذج تلخيص مبادرة.فازت هذه الطريقة على خط الأساس على درجات الحمر، مما يدل على تفوق نماذجنا على أساس الأساس.تشير نتائج التقييم البشري إلى أن الملخصات الناتجة عن طريقتنا أكثر واقعية ولديها أخطاء معدلة أقل.
تدوين المعرفة المنطقية في الآلات هو هدف طويل الأطول من الذكاء الاصطناعي. في الآونة الأخيرة، تم إحراز تقدم كبير نحو هذا الهدف مع تقنيات بناء قاعدة المعرفة التلقائية (KB). ومع ذلك، فإن هذه التقنيات تركز في المقام الأول على اكتساب بيانات KB الإيجابية (T RUE)، على الرغم من أن البيانات السلبية (الخاطئة) غالبا ما تكون مهمة أيضا للمنطق التمييزي على متن العموم KBS. كخطوة أولى نحو الأخير، تقترح هذه الورقة NEGATER، وهو إطار يصنف السلبيات المحتملة في العمولة KBS باستخدام نموذج لغة سياقي (LM). الأهم من ذلك، حيث لا تحتوي معظم KBS على السلبيات، تعتمد Negater فقط على المعرفة الإيجابية في LM ولا تتطلب أمثلة سلبية للحقيقة. توضح التجارب أنه مقارنة بنهج تكبير البيانات المتعاقبة متعددة النزاع، فإن نطاط غلة السلبيات التي تعتبر أكثر حكما متماسكا ومفيدا --- تؤدي إلى تحسينات دقة ذات دلالة إحصائية في مهمة استكمال KB صعبة وتؤكد أن المعرفة الإيجابية في LMS يمكن إعادة -العرضة "لتوليد المعرفة السلبية.
تحذير: تحتوي هذه الورقة على محتوى قد يكون مسيء أو مزعجا.تستخدم قواعد المعرفة المنطقية (CSKB) بشكل متزايد لمختلف مهام معالجة اللغة الطبيعية.نظرا لأن CSCBS هي في الغالب التي تم إنشاؤها في الغالب وقد تعكس التحيزات المجتمعية، من المهم التأكد من عدم الخلط بين هذه التحيزات بمفهوم المنطقية.نحن هنا نركز على اثنين من CSCBS واستخدامه على نطاق واسع، والفصح والنهاهي والنهاهي، وتأسيس وجود التحيز في شكل نوعين من الأضرار التمثيلية، والانتعاش في التصورات الاستقطابية وتفاوت التمثيل في مختلف المجموعات الديموغرافية في كلا CSCBS.بعد ذلك، نجد أضرارا تمثيلية مماثلة للنماذج المصب التي تستخدم المفاهيم.أخيرا، نقترح نهجا قائم على الترشيح لتخفيف هذه الأضرار، ويلاحظ أن نهجنا المستندات المرتبطا يمكن أن يقلل من المشكلات في كل من الموارد والنماذج ولكن يؤدي إلى انخفاض الأداء، مغادرة المجال للعمل في المستقبل لبناء نماذج المنطقية أكثر عدالة وأقوىوبعد

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا