ترغب بنشر مسار تعليمي؟ اضغط هنا

مؤشرات الوكيل لجودة الحوارات المحملة المفتوحة

Proxy Indicators for the Quality of Open-domain Dialogues

66   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

لا يزال التقييم التلقائي للحوارات المفتوحة للحوالات تحديا ملحوظا إلى حد كبير.على الرغم من وفرة العمل المنجز في هذا المجال، يتعين على القضاة البشري تقييم جودة الحوارات.نتيجة لذلك، يؤدي أداء هذه التقييمات على نطاق واسع مكلفة.يحقق هذا العمل في استخدام نموذج تعليمي عميق مدرب على التقييم التقييم في اللغة العامة (الغراء) بمثابة إشارة عالية الجودة للحوارات المفتوحة للنطاق.الهدف من ذلك هو استخدام مهام الغراء المختلفة كوجهات نظر مختلفة بشأن الحكم على جودة المحادثة، وبالتالي تقليل الحاجة إلى بيانات تدريبية إضافية أو ردود تعمل بمثابة مراجع جودة.نظرا لهذه الطبيعة، يمكن للطريقة استنتاج مختلف مقاييس الجودة ويمكن أن تستمد النتيجة الإجمالية القائمة على المكونات.نحن نحقق معاملات الارتباط ذات دلالة إحصائية تصل إلى 0.7.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعتبر عملية التصميم المعماري معقدة نسبياً نظراً لاختلاف مضمونها مع اختلاف المستخدمين, بالتالي فإن كل عملية تصميم لها ميزاتها الخاصة التي يصعب توحيدها, كما ينظر البعض إلى التصميم المعماري أنه عبارة عن عملية إنتاج لمرة واحدة, مما يجعل من الصعوبة قياس ج ودة التصميم المعماري نتيجة لعدم نمطية المعايير المستخدمة. البحث تناول عملية التصميم المعماري على أنها نتيجة لمجموعة من القرارات حول عدة مؤشرات تشكل عناصر الجودة في التصميم , التي يجب العمل عليها لتحسين الجودة في أي تصميم . يقدم البحث دراسة وصفية حول أدوات تقييم جودة التصميم المعماري المستخدمة عالمياً (على سبيل المثال DQI، DEEP، AEDET، HQI، LEED، BREEAM) لمعرفة معايير الجودة المعتمدة في كل أداة كخطوة نحو تشكيل إطار عام لمفهوم جودة التصميم المعماري للمباني السكنية, من خلال إجراء دراسة ميدانية للمعايير المستخلصة لتحديد درجة أهمية معايير جودة التصميم المعماري بالنسبة للمباني السكنية في مدينة اللاذقية. خلص البحث إلى مجموعة من المعايير الناظمة لجودة التصميم المعماري للمباني السكنية في مدينة اللاذقية.
تكتسب السدود في المناطق الساحلية أهمية كبيرة نظراً لاستخدامها في الري بشكل أساسي إضافة إلى استخدامها كمصدر من مصادر مياه الشرب في بعض الحالات. يهدف البحث إلى دراسة بعض المؤشرات الكيميائية لجودة مياه بعض السدود في محافظة اللاذقية على مدى العشر سنوات ا لأخيرة، شمل البحث دراسة تراكيز شوارد كل من الكلور، و الكبريتات، و النترات، و النتريت، و الفوسفات، و الصوديوم و البوتاسيوم في خمسة سدود موزعة على امتداد ساحل محافظة اللاذقية، و هي سد بللوران، سد 16 تشرين، سد الثورة، سد صلاح الدين (السفرقية) و سد الحويز. أظهرت النتائج حدوث تغيرات مهمة في تراكيز معظم الشوارد خلال السنوات العشر الأخيرة، حيث بينت النتائج ارتفاع في تراكيز الشوارد في معظم السدود المدروسة، و لكن في الوقت نفسه هذا التغير ليس واحداً في جميع السدود بل كان يرتبط ارتباطاً وثيقاً بطبيعة السد و موقعه و سعته التخزينية.
نقوم بتطوير نظام موحد للإجابة مباشرة من أسئلة النص المفتوح النص قد تتطلب عددا مختلفا من خطوات الاسترجاع. نحن نوظف نموذجا واحدا للمحولات متعددة المهام لأداء جميع الملاحات الفرعية اللازمة - - استرجاع الحقائق الداعمة، وإعادة تشغيلها، والتنبؤ بإجابة جميع المستندات المستردة --- بطريقة تكرارية. نتجنب الافتراضات الحاسمة للعمل السابق لا ينقل جيدا إلى إعدادات العالم الحقيقي، بما في ذلك استغلال المعرفة بالعدد الثابت من خطوات الاسترجاع المطلوبة للإجابة على كل سؤال أو استخدام البيانات الوصفية الهيكلية مثل قواعد المعرفة أو روابط الويب التي لها توافر محدود. بدلا من ذلك، نقوم بتصميم نظام يمكنه الرد على أسئلة مفتوحة على أي مجموعة نصية دون معرفة مسبقة بتعقيد المعنى. لمحاكاة هذا الإعداد، نبني معيارا جديدا، يسمى BEERSQA، من خلال الجمع بين مجموعات البيانات الموجودة ذات الخطوة الحالية مع مجموعة جديدة من 530 سؤالا تتطلب ثلاث صفحات ويكيبيديا للرد عليها، توحيد إصدارات ويكيبيديا كوربور في العملية. نظهر أن نموذجنا يوضح أداء تنافسي على كل من المعايير الحالية وهذا المعيار الجديد. نجعل المعيار الجديد متاحا في https://beerqa.github.io/.
على الرغم من الأداء الرائع للنماذج التوليدية واسعة النطاق في محادثة مفتوحة، من المعروف أنها أقل عملية لبناء أنظمة محادثة في الوقت الفعلي بسبب ارتفاع الكمون. من ناحية أخرى، يمكن أن تعيد نماذج استرجاع الردود بأشياء أقل بكثير ولكنها تظهر أداء أدنى للنما ذج الإدارية على نطاق واسع لأن جودة المحادثة تحدها مجموعة استجابة محددة مسبقا. للاستفادة من كلتا النهجين، نقترح طريقة تدريب جديدة تسمى G2R (التقطير الاسترجلي من الاسترجاع) التي تحافظ على كفاءة نموذج استرجاع مع الاستفادة من القدرة على التحدث نموذجا إيديا واسع النطاق عن طريق غرس المعرفة بالتوليد نموذج في نموذج الاسترجاع. تتكون G2R من تقنيتين متميزتين من التقطير: يعزز G2R على مستوى البيانات مجموعة بيانات الحوار مع ردود إضافية النموذج المولد النطاق، وينقل G2R على مستوى النموذج درجة جودة الاستجابة التي تم تقييمها بواسطة نموذج التوليد إلى درجة نموذج الاسترجاع عن طريق فقدان المعرفة في التقطير. من خلال تجارب واسعة بما في ذلك التقييم البشري، نوضح أن نظام المحادثة المستندة إلى استرجاعنا المدربين مع G2R يدل على أداء محسن بشكل كبير مقارنة بنموذج استرجاع الأساس أثناء إظهار زمن الاستدلال الأساسي بشكل كبير من النماذج الإدارية على نطاق واسع.
منذ فترة طويلة تم حل الضمائر إلى مراحلها كمشكلة فهم لغة طبيعية أساسية.تعمل سابقا على قرار الضمير (PCR) في الغالب على حل الضمائر للإشارة في النص أثناء تجاهل السيناريو الإيفهور.الضمائر Exophoric شائعة في الاتصالات اليومية، حيث قد يستخدم المتحدثون بشكل مباشر الضمائر للإشارة إلى بعض الكائنات الموجودة في البيئة دون إدخال الكائنات أولا.على الرغم من عدم ذكر هذه الكائنات في نص الحوار، إلا أنها غالبا ما يتم ترحيلها من قبل الموضوعات العامة للحوار.بدافع من ذلك، نقترح الاستفادة بشكل مشترك السياق المحلي والمواضيع العالمية للحوارات لحل مشكلة PCR خارج النص.توضح تجارب واسعة فعالية إضافة موضوع تنظيم الموضوع لحل الضمائر الإيفولية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا