ترغب بنشر مسار تعليمي؟ اضغط هنا

محاكاة الدردشة لنظم حوار البناء: تعلم إنشاء محادثات من التعليمات

Simulated Chats for Building Dialog Systems: Learning to Generate Conversations from Instructions

49   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتم إنشاء مجموعات بيانات الحوار الشائعة مثل MultiWoz من خلال توفير تعليمات حشد من التعليمات، معبرا عنها بلغة طبيعية، والتي تصف المهمة التي يجب إنجازها.يلعب عمال الحشد دور مستخدم وكيل لتوليد الحوار لإنجاز المهام التي تنطوي على جداول حجز مطعم، وتدعو إلى سيارة أجرة وما إلى ذلك. في هذه الورقة، نقدم استراتيجية إنشاء بيانات تستخدم نموذج اللغة المدرب مسبقا، GPT2، لمحاكاةالتفاعل بين عمال الحشد من خلال إنشاء روبوت مستخدم وبوت وكيل.نحن ندرب المحاكاة باستخدام نسبة أصغر من المحادثات الناتجة عن الحشود الفعلية وتعليماتها المقابلة.نوضح ذلك باستخدام البيانات المحاكاة، نحقق تحسينات كبيرة في إعدادات الموارد المنخفضة على مجموعة بيانات متوفرة للجمهور - مجموعة بيانات MultiWoz و DataSet Chamenta.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لكل مهمة حوار موجهة نحو تحقيق الأهداف ذات أهمية، يجب جمع كميات كبيرة من البيانات للحصول على التعلم المنتهي للنظام الحوار العصبي.جمع هذه البيانات هي عملية مكلفة وتستغرق وقتا طويلا.بدلا من ذلك، نوضح أنه يمكننا استخدام كمية صغيرة فقط من البيانات، والتي تستكمل البيانات من مهمة حوار ذات صلة.فشل التعلم بسذاجة من البيانات ذات الصلة في تحسين الأداء لأن البيانات ذات الصلة يمكن أن تكون غير متسقة مع المهمة المستهدفة.نحن نصف طريقة تعتمد على التعلم التعريفي والتي تتعلم بشكل انتقائي من بيانات مهمة الحوار ذات الصلة.نهجنا يؤدي إلى تحسينات بدقة كبيرة في مهمة الحوار مثال.
اكتسبت النماذج الإدارية لأنظمة الحوار اهتماما كبيرا بسبب النجاح الأخير من RNN والنماذج القائمة على المحولات في مهام مثل الإجابة على الأسئلة والتلخيص. على الرغم من أن مهمة استجابة الحوار ينظر إليها عموما على أنها تسلسل للتسلسل (SEQ2SEQ) المشكلة، فقد و جدت الباحثون في الماضي أنه يمثل تحديا لتدريب أنظمة الحوار باستخدام نماذج SEQ2SEQ القياسية. لذلك، لمساعدة النموذج على تعلم نطق حقيقي وميزات مستوى المحادثة، Sordoni et al. (2015B)، serban et al. (2016) بنية RNN الهرمية المقترحة، التي تم اعتمادها لاحقا من قبل العديد من أنظمة الحوار RNN الأخرى. مع النماذج القائمة على المحولات التي تسيطر على مشاكل SEQ2SeQ مؤخرا، فإن السؤال الطبيعي الذي يجب طرحه هو قابلية مفهوم التسلسل الهرمي في أنظمة الحوار المحول. في هذه الورقة، نقترح إطارا عمليا لترميز المحولات الهرمية وإظهار كيف يمكن تحويل محول قياسي إلى أي ترميز هرمي، بما في ذلك Hred و Hibert مثل النماذج، باستخدام أقنعة اهتمام مصممة خصيصا والترميزات الموضعية. نوضح أن الترميز الهرمي يساعد في تحقيق فهم لغوي أفضل في اللغة الطبيعية للسياق في النماذج القائمة على المحولات لأنظمة الحوار الموجهة نحو المهام من خلال مجموعة واسعة من التجارب.
يمكن تصنيف الأجهزة المحمولة، التي تلخص تماما المواضيع الرفيعة المستوى التي تمت مناقشتها في وثيقة، في عبارة البصرة الحالية التي تظهر صراحة في النص المصدر والفتحية الغائبة التي لا تتطابق مع أي لاحق متجاور ولكنه مرتبط للغاية بالمصدر. معظم نهج توليد مفات يح المفاتيح الموجودة تولد بمتزامنة خط أساتيجية موجودة وتغيب دون تمييز هذه الفئتين بشكل صريح. في هذه الورقة، يقترح اقتراح نهج محدد (SGG) في التعامل مع توليد الجماهير الموجود والمجابطة الحاضر بشكل منفصل مع آليات مختلفة. على وجه التحديد، SGG هي شبكة عصبية هرمية تتألف من محدد مقرا لها في طبقة منخفضة تتركز على جيل المفتاح الحالي، ومولد موجه في الاختيار في طبقة عالية مخصصة للتغيب عن جيل تسخير الغيام، ووحشية في المنتصف معلومات من محدد للمولد. النتائج التجريبية على أربعة معايير توليد مفاتيح المفاتيح توضح فعالية طرازنا، والتي تتفوق بشكل كبير على خطوط الأساس القوية لكلا الجداول الرائعة الحالية والمغادرة. علاوة على ذلك، فإننا نقدم SGG إلى مهمة توليد العنوان تشير إلى إمكانية قدرتها على مهام توليد اللغة الطبيعية.
الحوار المرئي صعبا لأنه يحتاج إلى الإجابة على سلسلة من الأسئلة المتماسكة بناء على فهم البيئة المرئية. كيفية الأرض الكائنات المرئية ذات الصلة هي واحدة من المشاكل الرئيسية. تستخدم الدراسات السابقة السؤال والتاريخ للحضور في الصورة وتحقيق أداء مرضي، في ح ين أن هذه الطرق ليست كافية لتحديد الكائنات المرئية ذات الصلة دون أي إرشادات. يحظر التأريض غير المناسب للكائنات المرئية أداء نماذج الحوار المرئي. في هذه الورقة، نقترح نهجا جديدا لتعلم الكائنات المرئية البرية للحوار المرئي، والذي يستخدم آلية تأريض كائنات مرئية جديدة حيث يتم استخدام كل من التوزيعات السابقة والخلفية على الكائنات المرئية لتسهيل التأريض البصرية. على وجه التحديد، يتم استنتاج التوزيع الخلفي على الكائنات المرئية من كل من السياق (التاريخ والأسئلة) والأجوبة، وتضمن التأريض المناسب للأشياء المرئية أثناء عملية التدريب. في هذه الأثناء، يتم استخدام توزيع مسبق، الذي يستنتج من السياق فقط، لتقريب التوزيع الخلفي بحيث يمكن أن تكون الكائنات المرئية المناسبة هي التأريض حتى بدون إجابات أثناء عملية الاستدلال. النتائج التجريبية على مجموعة بيانات V0.9 و V1.0 Visdial تثبت أن نهجنا يحسن النماذج القوية السابقة في كل من الإعدادات الإدارية والتمييزية من خلال هامش هامش.
على الرغم من التقدم الرائع في مجال الوسائط الحسابية، غالبا ما تعتمد نظم الحوار المعنية ذات المهام الجدلية على المعرفة المهيكلة حول الحجج وعلاقاتها. نظرا لأن الاستحواذ اليدوي لهياكل الوسيطة هذه تستغرق وقتا طويلا، فإن النظم المقابلة غير مرنة فيما يتعلق بالموضوعات التي يمكنهم مناقشتها. لمعالجة هذه المشكلة، نقترح مجموعة من أنظمة الحوار الجدلية مع تكنولوجيا البحث الحجة التي تمكن النظام من مناقشة أي موضوع يقوم بمحرك البحث قادرا على العثور على حجج مناسبة. يستخدم نهجنا تصنيف العلاقة المستندة إلى التعلم في التعلم لتعيين الحجج المستردة في بنية شجرة عامة للاستخدام في أنظمة الحوار. نقيم النهج مع حالة من محرك البحث الفني ونموذج حوار تم إدخاله مؤخرا في دراسة مستخدم مكثفة فيما يتعلق بتماسك الحوار. تختلف النتائج بين الموضوعات التي تم التحقيق فيها (وبالتالي تعتمد على جودة البيانات الأساسية) ولكنها في بعض الحالات قريبة بشكل مدهش من النتائج التي تحققت مع هيكل الوسيطة المشروح يدويا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا