ترغب بنشر مسار تعليمي؟ اضغط هنا

NDH-Full: تعلم وتقييم العوامل الملاحية على حوار كامل الطول

NDH-Full: Learning and Evaluating Navigational Agents on Full-Length Dialogue

284   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتماشى التواصل بين الوكلاء البشري والهاتف المحمول بشكل متزايد حيث يتم نشر هذه الوكلاء على نطاق واسع في حياتنا اليومية. الرؤية والحوار الملاحة هي واحدة من المهام التي تقوم بتقييم قدرة الوكيل على التفاعل مع البشر للحصول على المساعدة والتنقل على أساس ردود اللغة الطبيعية. في هذه الورقة، نستكشف الملاحة من مهمة تاريخ الحوار (NDH)، والتي تستند إلى مجموعة بيانات الملاحة في الرؤية والحوار التعاوني (CVDN)، وتقديم نموذج أحدث من الفن الذي تم بناؤه عند الرؤية محولات اللغة. ومع ذلك، على الرغم من تحقيق الأداء التنافسي، نجد أن الوكيل في مهمة NDH لم يتم تقييمه بشكل مناسب من خلال التقدم المتقدي الرئيسي - الهدف. من خلال تحليل عدم تطابق الأداء بين تقدم المرمى ومقاييس أخرى (على سبيل المثال، تزييف الوقت الديناميكي الطبيعي) من نموذج الحديث لدينا، نوضح أن إعداد المهام المستندة إلى المسار الفرعي NDH (أي، التنقل إلى مسار جزئي بناء على مراسله لا توفر مجموعة فرعية من الحوار الكامل الوكيل مع إشارة إشراف كافية نحو منطقة الهدف. لذلك، نقترح إعداد مهمة جديدة يسمى NDH - الكامل الذي يأخذ الحوار الكامل ومسار التنقل بأكمله كحل واحد. نقدم نموذجا أساسيا قويا وإظهار النتائج الأولية في هذه المهمة الجديدة. وصفنا كذلك العديد من الأساليب التي نحاولها، من أجل تحسين الأداء النموذجي (بناء على تعلم المناهج الدراسية، ما قبل التدريب، وتعزيز البيانات)، مما يشير إلى طرق تدريب مفيدة محتملة في هذه المهمة الجديدة NDH الجديدة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تمكين أنظمة حوار المجال المفتوح لطرح أسئلة توضيحية عند الاقتضاء هو اتجاه مهم لتحسين جودة استجابة النظام.وهي، بالنسبة للحالات عندما يكون طلب المستخدم غير محددا لنظام محادثة لتوفير إجابة على الفور، فمن المستحسن طرح سؤال توضيحي لزيادة فرص استرداد إجابة مرضية.لمعالجة مشكلة توضيح الأسئلة في الحوارات المفتوحة في الحوارات ": (1) نجمع وتحرير مجموعة بيانات جديدة تركز على المحادثات المفتوحة ومتعددة الدورات، (2) نحن معيارا عدة حالاتخطوط الأساس العصبية الفن، و (3) نقترح خط أنابيب يتكون من خطوات غير متصلة بالإنترنت وعلى الإنترنت لتقييم جودة توضيح الأسئلة في حوارات مختلفة.هذه المساهمات مناسبة كمؤسسة لمزيد من البحث.
سيحتاج الوكلاء الذكيون الذين يشترفون بمفاهيم جديدة في البيئات المحددة إلى طلب أسئلة زملائهم البشريين الذين يتعلمون عن العالم المادي.لفهم هذه المشكلة بشكل أفضل، نحتاج إلى بيانات حول طرح الأسئلة في التفاعلات القائمة على المهمة المحددة.تحقيقا لهذه الغاي ة، نقدم كوربوس لتعلم الحوار البشري الروبوت (HURDL) - وهو جوربوس حوار رواية تم جمعها في بيئة افتراضية تفاعلية عبر الإنترنت التي يلعب فيها المشاركين البشري دور الروبوت الذي يؤدي مهمة تنظيم أدوات تعاونية.نحن نصف بيانات Corpus ومخطط التوضيح المقابل لتقديم نظرة ثاقبة في شكل ومضمون الأسئلة التي يطلبها البشر تسهيل التعلم في بيئة داخلية.نحن نقدم كوربوس كمورد مضمون تجريبيا لتحسين توليد السؤال في الوكلاء الذكيين المحتملين.
ستعلم وكلاء المحادثة المدربون على كوربورا كبيرة غير مبالين في التفاعلات البشرية أنماطا وسلوكيات محاكية فيها، والتي تشمل سلوكا هجوميا أو ساما.نقدم إطارا جديدا للإنسان والحلقة النموذجية لتقييم سمية هذه النماذج، ومقارنة مجموعة متنوعة من الأساليب الحالية في كل من حالات المستخدمين غير المصندين والموديين الذين يعرضون نقاط ضعفهم.ثم نذهب لاقتراح طريقتين روايتين لعوامل المحادثة الآمنة، إما عن طريق التدريب على البيانات من إطار عملنا الجديد للنسب في الحلقة في نظام من مرحلتين، أو "سلامة" في "الخبز"إلى نموذج الولادة نفسه.نجد تقنياتنا الجديدة هي (ط) أكثر أمانا من النماذج الحالية؛في حين أنه (2) الحفاظ على مقاييس قابلية الاستقرار مثل التجذير بالنسبة لشركة Chatbots الحديثة.على النقيض من ذلك، فإننا نعرض مشكلات سلامة خطيرة في الأنظمة القياسية الحالية مثل GPT2، حوالة، و BlenderBot.
ندرس مهمة التعلم وتقييم embeddings الصينية.نقوم أولا بإنشاء مجموعة بيانات تقييم جديدة تحتوي على مرادفات IDIOM والمتضادات.قد لا تكون مراقبة أن طرق تضمين الكلمة الصينية الحالية قد لا تكون مناسبة لتعلم Adiom AregBeddings، ونحن نقدم طريقة قائمة على بيرت التي تتعلم مباشرة أن تضمين ناقلات التعابير الفردية.نحن نقارن تجريبيا الأساليب الحالية وطريقتنا.نجد أن طريقتنا تتفوق بشكل كبير على الأساليب الحالية على مجموعة بيانات التقييم التي شيدناها.
يركز هذه البحث على تقصي النقاط التي لم تغطِ بشكل كامل ضمن منهجيات هندسة البرمجيات المقادة بالوكلاء (AOSE) و قد اعتمد على مراجعة موسعة لهذه المنهجيات. ترتكز هذه الورقة بشكل أساسي على أن كل منهجية لها نقاط قوتها و ضعفها و قد تركز على بعض مراحل دورة الح ياة البرمجية و ليس عليها كلها مجتمعة. العمل المقدم هنا يقدم تمديداً لواحدة من أهم منهجيات هندسة البرمجيات المقادة بالوكلاء (MaSE) التي تعد من أقوى المنهجيات و لكنها لا تعير اهتماماُ كافياُ لمرحلة التحليل المبكر للمتطلبات. يعتمد العمل على المكاملة مع إحدى المنهجيات التي تركز على مرحلة المتطلبات، و هذه المكاملة اقتضت تطوير مجموعة موسعة من قواعد التحويل بين بيئتين برموز و مفاهيم متباينة، و بناء برنامج يؤتمت عملية التحويل. و تعرض هذه الورقة أيضاً مثالاً كاملا case study نطبق عليه العمل المنجز.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا