ترغب بنشر مسار تعليمي؟ اضغط هنا

Cider-R: تقييم الدلالة القائمة على توافق الآراء

CIDEr-R: Robust Consensus-based Image Description Evaluation

352   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تظهر هذه الورقة أن عصير التفاح، مقياس التقييم التقليدي لوصف الصورة، لا يعمل بشكل صحيح على مجموعات البيانات حيث يكون عدد الكلمات في الجملة أكبر بكثير من تلك الموجودة في مجموعة بيانات التسميات التوضيحية MS COCO.نظهر أيضا أن CIDER-D لديه أداء يعوقه عدم وجود جمل مرجعية متعددة والتباين العالي لطول الجملة.لتجاوز هذه المشكلة، نقدم Cider-R، الذي يحسن CIDER-D، مما يجعله أكثر مرونة في التعامل مع مجموعات البيانات ذات تباين طول الجملة.نوضح أن عصير التفاح هو أكثر دقة وأقرب من الحكم الإنساني من عصير التفاح.Cider-R هو أكثر قوة فيما يتعلق بعدد المراجع المتاحة.تكشف نتائجنا أن استخدام تدريب التسلسل الحرج الذاتي لتحسين عصير التفاح - يولد تعليقا وصفيا.في المقابل، عند تحسين CIDER-D، يميل طول التسميات التوضيحية التي تم إنشاؤها إلى أن تكون مشابهة للطول المرجعي.ومع ذلك، تكرر النماذج أيضا عدة مرات نفس الكلمة لزيادة طول الجملة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم إجراء منهجي لقرار الخلاف الدولي.الإجراء عام، ولكن الاستخدام بشكل خاص في مهام التعليق المتعددة موجهة نحو بناء الحقيقة الأرضية.نقوم بحفز اقتراحنا من خلال القول بأن هدف الحالات التي يحظر فيها هدف الباحثين هو استنباط نقاط وجهة نظر مختلفة، فإن الخلاف القاطع هو علامة على ضعف الجودة في التصميم أو وصف المهمة.إجماع في الآراء بين المحن المعلقين، نحافظ، يجب أن ينتضل، من خلال إجراء منهجي لحل الخلاف مثل الوصف الذي نصفه.
في هذه الورقة العلمية تعاملنا مع ثلاثة أنواع من التشاكلات بين مثاليين في حلقة (واحدية) R و هي: تشاكل حلقي، و R ـ تشاكل مودولي، و تشاكل مثالي. و ذكرنا عدداً من الأمثلة على ذلك، و أثبتنا أن أسرة المثاليات في الحلقة R مع (التشاكلات الحلقية، R ـ تشاكلا ت المودلية، التشاكلات المثالية) تُشكل فئـة دعوناها فئة مثاليات من النوع (الأول، الثاني، الثالث) على الترتيب.
حققت نماذج اللغة المدربة مسبقا (PTLMS) أداء مثير للإعجاب في معايير استنتاج المنطقية، لكن قدرتها على استخدام المناولة لإستنساخ قوي، وهو أمر ضروري للاتصالات الفعالة مع البشر،. في السعي لتحقيق الاتصالات السائل للاتصالات الإنسانية، نقترح تحديا جديدا، ريك ا: الاستدلال القوي باستخدام بديهيات المنطقية، التي تقيم الاستدلال القوي المنزلي على الرغم من الاضطرابات النصية. لتوليد بيانات لهذا التحدي، نقوم بتطوير إجراءات منهجية وقابلة للتطوير باستخدام قواعد المعرفة المنطقية والتحقيق PTLMS عبر إعدادين تقييمين مختلفين. تبين تجارب واسعة النطاق على مجموعات التحقيق التي تم إنشاؤها مع أكثر من 10K عبارات أن ptlms لا تؤدي أفضل من التخمين العشوائي على إعداد اللقطة الصفرية، وتتأثر بشدة بالتحيزات الإحصائية، وهي ليست قوية لهجمات الاضطراب. نجد أيضا أن الضبط الدقيق حول تصريحات مماثلة تقدم مكاسب محدودة، حيث لا تزال PTLMS تفشل في تعميم الاستدلالات غير المرئية. يعرض مؤشرنا الجديد واسع النطاق فجوة كبيرة بين PTLMS وفهم لغة الإنسان ويقدم تحديا جديدا ل PTLMS لإظهار العمولة.
تناقش هذه الورقة نهجا قائما على التصنيف لتقييم الترجمة الآلي، بدلا من نهج قائم على الانحدار المشترك في مهمة مقاييس WMT.تعمل الترجمة الآلية الحديثة عادة بشكل جيد ولكن في بعض الأحيان تجعل الأخطاء الحرجة بسبب بعض خيارات كلمة خاطئة فقط.يركز نهجنا القائم على التصنيف على هذه الأخطاء باستخدام العديد من ملصقات نوع الخطأ، لتقييم ترجمة الآلات العملي في عصر الترجمة الآلية العصبية.لقد بذلنا شرحا إضافيا على مجموعات بيانات المقاييس 2015-2017 مع ملصقات الطلاقة والكفاية لتمييز أنواع مختلفة من أخطاء الترجمة من نقاط العرض النحوية والدلسة.نقدم معايير التقييم البشرية لدينا لتطوير Corpus وتجارب التقييم التلقائي باستخدام Corpus.سيتم إتاحة كوربوس التقييم البشري علنا عند النشر.
في هذه الورقة نقدم نموذج إكمال رمز التعلم العميق للغة R.نقدم عدة تقنيات لاستخدام الهندسة المعمارية القائمة على نمذجة اللغة في مهمة إكمال التعليمات البرمجية.مع هذه التقنيات، يتطلب النموذج موارد منخفضة، ولكن لا يزال يحقق جودة عالية.نقدم أيضا بيانات تقي يم لمهمة إتمام لغة ص.تحتوي DataSet لدينا على سياقات استخدام الإكمال التلقائي المتعدد توفر نتائج صحة قوية.DataSet متاحة للجمهور.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا