ترغب بنشر مسار تعليمي؟ اضغط هنا

كيفية تحفيز التنين الخاص بك: تدريس وكلاء يحركهم الأهداف للتحدث والتصرف في عوالم الخيال

How to Motivate Your Dragon: Teaching Goal-Driven Agents to Speak and Act in Fantasy Worlds

263   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نسعى إلى إنشاء وكلاء يتصرفون والتواصل مع الوكلاء الآخرين في السعي لتحقيق هدف.تحقيقا لهذه الغاية، نقوم بتمديد الضوء (Urbanek et al. 2019) --- لعبة نصية خيال من الحشد على نطاق واسع - مع مجموعة بيانات من المهام.هذه تحتوي على دوافع لغوية طبيعية مقترنة بأهداف في اللعبة والمظاهرات البشرية؛قد يتطلب إكمال السعي حوار أو إجراءات (أو كليهما).نقدم نظام لتعليم التعزيز (1) يشتمل على التدريب المستندة إلى النمذجة على النمذجة القائمة على النمذجة على النمذجة على نطاق واسع ومقرها مسبقا لإشراف الوكيل مع البثور ذات الصلة؛و (2) يرفع مساحة عمل عوامل من أوامر العمل والحوار، موازنة بين الاثنين.نقوم بإجراء تقييمات طلقة صفرية باستخدام مظاهرات الخبراء البشرية المحتفظ بها، والتي تبين أن عملائنا قادرون على التصرف باستمرار والتحدث بشكل طبيعي فيما يتعلق بدوافعهم.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الألعاب القائمة على النص محاكاة العالمين والتفاعل مع اللاعبين باستخدام اللغة الطبيعية. لقد استخدمها العمل الحديث كخطأ في وكلاء فهم اللغة المستقلة، مع وجود الدافع هو فهم معاني الكلمات أو الدلالات هو مكون رئيسي في كيفية فهم البشر والسبب والتصرف في هذه العوالم. ومع ذلك، لا يزال غير واضح إلى أي مدى يستخدم الوكلاء الاصطناعي الفهم الدلالي للنص. تحقيقا لهذه الغاية، نقوم بإجراء تجارب لتقليل كمية المعلومات الدلالية المتاحة لعامل التعلم. من المستغرب أن نجد أن الوكيل قادر على تحقيق درجات عالية حتى في الغياب التام للدليل اللغوي، مما يشير إلى أن الإعداد التجريبي الشهير حاليا قد تكون مصممة بشكل سيء لفهم واستفادة من نصوص اللعبة. لعلاج هذا النقص، نقترح فك تشفير ديناميات عكسية لتنظيم مساحة التمثيل وتشجيع الاستكشاف، مما يدل على تحسين الأداء في العديد من الألعاب بما في ذلك زورق الأول - نناقش الآثار المترتبة على نتائجنا لتصميم وكلاء في المستقبل مع فهم دلالي أقوى.
تم إثبات مهام معالجة اللغة الطبيعية (NLP)، بدءا من تصنيف النص إلى جيل النص، من خلال نماذج اللغة المحددة مسبقا، مثل بيرت. هذا يسمح للشركات بإنشاء برامج برت أقوى بسهولة عن طريق تثبيت نماذج Berted Brounded لمهام المصب. ومع ذلك، عندما يتم نشر نموذج Berte d Berted كخدمة، فقد يعاني من هجمات مختلفة تم إطلاقها من قبل المستخدمين الضارين. في هذا العمل، نقدم أولا كيف يمكن أن يسرق الخصم خدمة API القائمة على BERT (النموذج الضحية / الهدف) على مجموعات بيانات معطرة متعددة ذات معرفة مسبقة محدودة واستفسارات. نوضح كذلك أن النموذج المستخرج يمكن أن يؤدي إلى هجمات خصومة قابلة للتحويل شديدة ضد نموذج الضحية. تشير دراساتنا إلى أن نقاط الضعف المحتملة لخدمات API القائمة على بيرت لا تزال تعقد، حتى عندما يكون هناك عدم تطابق معماري بين نموذج الضحية ونموذج الهجوم. أخيرا، نبحث في استراتيجيات دفاعتين لحماية نموذج الضحية، وإيجاد أنه ما لم يتم التضحية بأداء نموذج الضحايا، فإن كلا من استخراج النماذج والانتفاخ الخصوم يمكن أن تساوم على نحو فعال النماذج المستهدفة.
في أنظمة الحوار الموجهة نحو الأهداف، يقدم المستخدمون المعلومات من خلال قيم الفتحة لتحقيق أهداف محددة. عمليا، يمكن أن تكون بعض مجموعات قيم الفتحة غير صالحة وفقا للمعرفة الخارجية. على سبيل المثال، مزيج من بيتزا الجبن "(عنصر القائمة) وملفات تعريف الارتب اط OREO" (تتصدر) من كلام الإدخال يمكن أن أطلب بيتزا جبنة مع ملفات تعريف الارتباط Oreo على القمة؟ "تعويضات مثل هذه المجموعات غير الصالحة وفقا للقائمة من مطعم العمل. تسمح أنظمة الحوار التقليدية بإعدام قواعد التحقق من الصحة كخطوة بعد المعالجة بعد أن تم ملء الفتحات التي يمكن أن تؤدي إلى تراكم الخطأ. في هذه الورقة، نقوم بإضفاء الطابع الرسمي على قيود فتحة مدفوعة بالمعرفة وتقديم مهمة جديدة من اكتشاف انتهاك القيد مصحوبة ببيانات معايير. ثم نقترح طرق لإدماج المعرفة الخارجية في الكشف عن انتهاك الانتهاك في النظام والنموذج كمركز تصنيف نهاية إلى نهج ومقارنته لنهج خط أنابيب القواعد التقليدي. تجرب التجارب على مجاليين من مجموعة بيانات متعددة الأوجه من تحديات الكشف عن انتهاك القيود وتضع المرحلة للعمل في المستقبل والتحسينات.
أن تكون شركاء محادثة جيدة، يجب تدريب أنظمة معالجة اللغة الطبيعية (NLP) على إنتاج كلمات مفيدة بشكل سياق. حقق العمل المسبق في تدريب أنظمة NLP بالأهداف القائمة على الاتصالات، حيث يقف المستمع العصبي كشريك اتصال. ومع ذلك، فإن هذه الأنظمة تعاني عادة من الا نجراف الدلالي حيث تتلاشى اللغة المستفادة جذريا من اللغة الطبيعية. نقترح طريقة تستخدم سكان المستمعين العصبيين لتنظيم تدريب المتكلم. نوضح أولا أن الانجراف اللغة ينشأ من معايرة عدم اليقين الفقيرة لمستمع عصبي، مما يجعل تنبؤات عالية اليقين على جمل الرواية. نستكشف من مجموعات المستمعين الفرقة والمقرها الفرقة والتسرب والعثور على أن النتائج السابقة في تحسين كمية عدم اليقين بشكل أفضل. نقيم كل من الأهداف القائمة على السكان بشأن الألعاب المرجعية، وإظهار أن طريقة الفرقة مع معايرة أفضل تمكن المتحدث من توليد الكلام البراغماتية مع التحول إلى مفردات كبيرة وتعميم للألعاب والمستمعين الجديدة.
القيلات السحائية النخاعية آفة كثيرة الشيوع ببلادنا، و للأسف معظم الإصابات بها تنتهي بإعاقة و عاهة دائمة، و قسم كبير من هؤلاء الأطفال نفقدهم بالتهاب سحايا عقابيل تلك القيلات. و هنا نطرح التساؤل: لِم هذه الآفات شائعة ببلادنا في حين أصبحت شبه نادرة بال بلدان المتقدمة؟ لا تزال نسبة القيلات السحائية النخاعية التي تراجع مشفى الأطفال و غيره من المراكز الصحية شائعة جداً فيجب معرفة ما الأسباب و العوامل المؤهبة لحدوثها، و ذلك بغية التقليل من نسبة حدوثها و معرفة مدى علاقتها بالحمل و ظروف الحمل و صلة القربى بين الأبوين و تناول حمض الفوليك لدى الحامل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا