لا يزال التقييم التلقائي للحوارات المفتوحة للحوالات تحديا ملحوظا إلى حد كبير.على الرغم من وفرة العمل المنجز في هذا المجال، يتعين على القضاة البشري تقييم جودة الحوارات.نتيجة لذلك، يؤدي أداء هذه التقييمات على نطاق واسع مكلفة.يحقق هذا العمل في استخدام نموذج تعليمي عميق مدرب على التقييم التقييم في اللغة العامة (الغراء) بمثابة إشارة عالية الجودة للحوارات المفتوحة للنطاق.الهدف من ذلك هو استخدام مهام الغراء المختلفة كوجهات نظر مختلفة بشأن الحكم على جودة المحادثة، وبالتالي تقليل الحاجة إلى بيانات تدريبية إضافية أو ردود تعمل بمثابة مراجع جودة.نظرا لهذه الطبيعة، يمكن للطريقة استنتاج مختلف مقاييس الجودة ويمكن أن تستمد النتيجة الإجمالية القائمة على المكونات.نحن نحقق معاملات الارتباط ذات دلالة إحصائية تصل إلى 0.7.
The automatic evaluation of open-domain dialogues remains a largely unsolved challenge. Despite the abundance of work done in the field, human judges have to evaluate dialogues' quality. As a consequence, performing such evaluations at scale is usually expensive. This work investigates using a deep-learning model trained on the General Language Understanding Evaluation (GLUE) benchmark to serve as a quality indication of open-domain dialogues. The aim is to use the various GLUE tasks as different perspectives on judging the quality of conversation, thus reducing the need for additional training data or responses that serve as quality references. Due to this nature, the method can infer various quality metrics and can derive a component-based overall score. We achieve statistically significant correlation coefficients of up to 0.7.
المراجع المستخدمة
https://aclanthology.org/
تعتبر عملية التصميم المعماري معقدة نسبياً نظراً لاختلاف مضمونها مع اختلاف المستخدمين, بالتالي فإن كل عملية تصميم لها ميزاتها الخاصة التي يصعب توحيدها, كما ينظر البعض إلى التصميم المعماري أنه عبارة عن عملية إنتاج لمرة واحدة, مما يجعل من الصعوبة قياس ج
تكتسب السدود في المناطق الساحلية أهمية كبيرة نظراً لاستخدامها في الري بشكل أساسي إضافة إلى استخدامها كمصدر من مصادر مياه الشرب في بعض الحالات. يهدف البحث إلى دراسة بعض المؤشرات الكيميائية لجودة مياه بعض السدود في محافظة اللاذقية على مدى العشر سنوات ا
نقوم بتطوير نظام موحد للإجابة مباشرة من أسئلة النص المفتوح النص قد تتطلب عددا مختلفا من خطوات الاسترجاع. نحن نوظف نموذجا واحدا للمحولات متعددة المهام لأداء جميع الملاحات الفرعية اللازمة - - استرجاع الحقائق الداعمة، وإعادة تشغيلها، والتنبؤ بإجابة جميع
على الرغم من الأداء الرائع للنماذج التوليدية واسعة النطاق في محادثة مفتوحة، من المعروف أنها أقل عملية لبناء أنظمة محادثة في الوقت الفعلي بسبب ارتفاع الكمون. من ناحية أخرى، يمكن أن تعيد نماذج استرجاع الردود بأشياء أقل بكثير ولكنها تظهر أداء أدنى للنما
منذ فترة طويلة تم حل الضمائر إلى مراحلها كمشكلة فهم لغة طبيعية أساسية.تعمل سابقا على قرار الضمير (PCR) في الغالب على حل الضمائر للإشارة في النص أثناء تجاهل السيناريو الإيفهور.الضمائر Exophoric شائعة في الاتصالات اليومية، حيث قد يستخدم المتحدثون بشكل