ترغب بنشر مسار تعليمي؟ اضغط هنا

بناء النصوص الموجهة نحو الأهداف

Goal-Oriented Script Construction

259   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن معرفة البرامج النصية سلاسل الأحداث المشتركة في السيناريوهات النمطية، هي أصول قيمة لأنظمة فهم اللغة الطبيعية الموجهة نحو المهام.نقترح مهمة بناء البرنامج النصي الموجهة نحو الأهداف، حيث ينتج نموذج سلسلة من الخطوات لإنجاز هدف معين.نحن نعارض مهمتنا في أول مجموعة بيانات تعليمية متعددة اللغات متعددة اللغات تدعم 18 لغة تم جمعها من Wikihow، وهو موقع على شبكة الإنترنت يحتوي على نصف مليون حول المقالات.بالنسبة إلى الأساس، نفكر في نهج قائم على الجيل باستخدام نموذج لغة ونهج يستند إلى استرجاعه من خلال استرداد الخطوات ذات الصلة لأول مرة من بركة مرشحة كبيرة ثم طلبها.نظرا لأن مهمتنا عملية، غير ممكنة ولكن صعبة النماذج المحولات الحديثة، وأن طرقنا يمكن نشرها بسهولة لمختلف مجموعات البيانات والمجالات الأخرى مع أداء طلقة صفرية لائقة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في أنظمة الحوار الموجهة نحو الأهداف، يقدم المستخدمون المعلومات من خلال قيم الفتحة لتحقيق أهداف محددة. عمليا، يمكن أن تكون بعض مجموعات قيم الفتحة غير صالحة وفقا للمعرفة الخارجية. على سبيل المثال، مزيج من بيتزا الجبن "(عنصر القائمة) وملفات تعريف الارتب اط OREO" (تتصدر) من كلام الإدخال يمكن أن أطلب بيتزا جبنة مع ملفات تعريف الارتباط Oreo على القمة؟ "تعويضات مثل هذه المجموعات غير الصالحة وفقا للقائمة من مطعم العمل. تسمح أنظمة الحوار التقليدية بإعدام قواعد التحقق من الصحة كخطوة بعد المعالجة بعد أن تم ملء الفتحات التي يمكن أن تؤدي إلى تراكم الخطأ. في هذه الورقة، نقوم بإضفاء الطابع الرسمي على قيود فتحة مدفوعة بالمعرفة وتقديم مهمة جديدة من اكتشاف انتهاك القيد مصحوبة ببيانات معايير. ثم نقترح طرق لإدماج المعرفة الخارجية في الكشف عن انتهاك الانتهاك في النظام والنموذج كمركز تصنيف نهاية إلى نهج ومقارنته لنهج خط أنابيب القواعد التقليدي. تجرب التجارب على مجاليين من مجموعة بيانات متعددة الأوجه من تحديات الكشف عن انتهاك القيود وتضع المرحلة للعمل في المستقبل والتحسينات.
إن القدرة على التباين في استخدام اللغة ضروري للمتحدثين لتحقيق أهدافهم المحادثة، على سبيل المثال عند الإشارة إلى الكائنات في البيئات المرئية.نقول أن التنوع لا ينبغي أن يكون على غرار كهدف مستقل في الحوار، ولكن يجب أن يكون نتيجة لذلك أو منتج ثاني لتوليد اللغة الموجهة نحو الأهداف.تم التحقيق في خطوط عمل مختلفة في توليد اللغة العصبية طرق فك تشفيرها لتوليد المزيد من الكلمات المتنوعة، أو زيادة المعلوماتية من خلال التفكير العملي.نربط تلك خطوط العمل وتحليل كيفية تأثير المنطق العملي أثناء فك التشفير على تنوع التسميات التوضيحية الناتجة عنها.نجد أن تعزيز التنوع نفسه لا يؤدي إلى تسهيلات مفيدة بشكل أكثر عمليا، لكن المنطق العملي يزيد من التنوع المعجمي.أخيرا، نناقش ما إذا كان الاستفادة من المعلوماتية بطرق غير معقولة بمرحلة ما بين اللغوي.
لكل مهمة حوار موجهة نحو تحقيق الأهداف ذات أهمية، يجب جمع كميات كبيرة من البيانات للحصول على التعلم المنتهي للنظام الحوار العصبي.جمع هذه البيانات هي عملية مكلفة وتستغرق وقتا طويلا.بدلا من ذلك، نوضح أنه يمكننا استخدام كمية صغيرة فقط من البيانات، والتي تستكمل البيانات من مهمة حوار ذات صلة.فشل التعلم بسذاجة من البيانات ذات الصلة في تحسين الأداء لأن البيانات ذات الصلة يمكن أن تكون غير متسقة مع المهمة المستهدفة.نحن نصف طريقة تعتمد على التعلم التعريفي والتي تتعلم بشكل انتقائي من بيانات مهمة الحوار ذات الصلة.نهجنا يؤدي إلى تحسينات بدقة كبيرة في مهمة الحوار مثال.
يسمح التعلم المستمر في أنظمة الحوار الموجهة نحو المهام للنظام بإضافة مجالات ووظائف جديدة للعمل الإضافي بعد النشر، دون تكبد التكلفة العالية لإعادة النظر في النظام بأكمله في كل مرة. في هذه الورقة، نقترح أول معيار تعلم مستمر على الإطلاق لأنظمة الحوار ال موجهة نحو المهام مع أن يتم تعلم 37 نطما بشكل مستمر في إعدادات التعلم المعدلة والنهاية. بالإضافة إلى ذلك، نقوم بتنفيذ ومقارنة خطوط أساسيات التعلم المستمرة المتعددة، ونقترحنا طريقة معمارية بسيطة ولكنها فعالة تعتمد على المحولات المتبقية. نشير أيضا إلى أن الأداء العلوي للتعلم المستمر يجب أن يكون يعادل التعلم المتعدد المهام عند توفر البيانات من جميع المجال في وقت واحد. توضح تجاربنا أن الطريقة المعمارية المقترحة وإجراءات استراتيجية تستند إلى إعادة التشغيل بسيطة تؤدي بشكل أفضل، من خلال هامش كبير، مقارنة بتقنيات التعلم المستمرة الأخرى، وأسوأ قليلا قليلا من العلوي المتعدد التعلم العلوي أثناء كونه 20x بشكل أسرع في تعلم النطاقات الجديدة. نحن نبلغ أيضا العديد من المفاضلات من حيث استخدام المعلمة وحجم الذاكرة ووقت التدريب، وهي مهمة في تصميم نظام حوار موجه نحو المهام. يتم إصدار المعيار المقترح لتعزيز المزيد من البحث في هذا الاتجاه.
نقترح مشكلة جديدة في مجال التعلم المنتهي في نهاية الحوار الموجهة نحو الوظيفة (TOD)، حيث يحاكي نظام مربع الحوار وكيل استكشاف الأخطاء وإصلاحها يساعد المستخدم من خلال تشخيص مشكلتهم (على سبيل المثال، السيارة لا تبدأ).ترتكز حوارات هذه الحوار في مخططات الم خططات الموسيقية الخاصة بالمجال، والتي من المفترض أن يتبع الوكيل أثناء المحادثة.تعرض مهمتنا تحديات تقنية جديدة من أجل TOD العصبي، مثل التأريض على الكلام إلى مخطط الانسيابي دون عبوات صريحة، في إشارة إلى الصفحات اليدوية الإضافية عندما يطلب المستخدم سؤالا توضيحا، والقدرة على اتباع مخططات انسيابية غير مرئية في وقت الاختبار.نقوم بإصدار مجموعة بيانات (Flodial) تتكون من 2،738 مربعا على 12 نقطة مخاطرة مختلفة لاستكشاف الأخطاء وإصلاحها.نقوم أيضا بتصميم نموذج عصبي، FLONET، والذي يستخدم بنية توليد تعزز استرجاع لتدريب وكيل الحوار.تجد تجاربنا أن الألهام يمكن أن تفعل نقل طلقة صفرية إلى مخططات انسيابية غير مرئية، ويضع خط أساس قوي للبحث في المستقبل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا