ترغب بنشر مسار تعليمي؟ اضغط هنا

يعكس نظام الحوار الإقناعي قدرة الجهاز على جعل التحركات الإستراتيجية تتجاوز التواصل اللفظي، وبالتالي يميز نفسه عن حوارات موجهة نحو المهام أو فتح المجال ولديها قيمها الفريدة الخاصة بها. ومع ذلك، لا تزال مشاكل التكرار والتناسق لا تزال قائمة في توليد است جابة الحوار ويمكن أن تؤثر بشكل كبير على تجربة المستخدم وتعيق نتائج الإقناع. علاوة على ذلك، على الرغم من أن نهج التعزيز (RL) قد حقق نجاحا كبيرا في المهام الاستراتيجية مثل الألعاب، إلا أنها تتطلب محاكاة مستخدم متطورة لتوفير ملاحظات في الوقت الفعلي لنظام الحوار، مما يحد من تطبيق RL على حوارات الإقناع. لمعالجة هذه المشكلات نحو نظام حوار أفضل للإقناع، نقوم بتطبيق RL لتحسين خط الأساس طراز اللغة دون محاكاة المستخدمين، وتقطير المعلومات على مستوى الجملة حول التكرار، والتناسق، والأهمية المهمة من خلال المكافآت. علاوة على ذلك، لإنجاز مهمة الإقناع بشكل أفضل، يتعلم النموذج من مظاهرة بشرية لتقليد سلوك الإقناع البشري واختيار الاستجابات الأكثر إقناعا. تشير التجارب إلى أن نموذجنا يتفوق على نماذج الحوار السابقة من الحوار السابقة على كل من المقاييس التلقائية ونتائج التقييم البشري على مهمة إقناع التبرع، ويولد محادثات أكثر تنوعا ومتسقا ومقنعة وفقا لتعليقات المستخدمين. سنقوم بإجراء التعليمات البرمجية والنموذج المتاحة للجمهور.
يلخص الحوار يساعد القراء على التقاط المعلومات البارزة من محادثات طويلة في الاجتماعات والمقابلات والمسلسلات التلفزيونية. ومع ذلك، فإن حوالات العالم الحقيقي تشكل تحديا كبيرا لنماذج التلخيص الحالية، حيث يتجاوز طول الحوار عادة حدود المدخلات التي تفرضها ا لنماذج المدربة مسبقا القائمة على المحولات، والطبيعة التفاعلية للحوالات هي المعلومات ذات الصلة أكثر تعتمد على السياق وقدر موزعة من المقالات الإخبارية. في هذا العمل، نقوم بإجراء دراسة شاملة حول تلخيص الحوار الطويل من خلال التحقيق في ثلاث استراتيجيات للتعامل مع مشكلة الإدخال المطول وتحديد موقع المعلومات ذات الصلة: (1) نماذج المحولات الموسعة مثل Longformer، (2) استرداد نماذج خط أنابيب العديد من طرق استرجاع الحوار النطق، و (3) نماذج ترميز الحوار الهرمي مثل HMNet. نتائجنا التجريبية على ثلاث مجموعات بيانات حوار طويلة (QMSUM، MediaSum، Searscreen) تبين أن نماذج خط أنابيب الاسترداد - بعد ذلك، تسفر عن أفضل أداء. نوضح أيضا أنه يمكن تحسين جودة الملخص مع نموذج استرجاع أقوى وأحيث محاكاة بيانات الملخصات الخارجية المناسبة.
في أنظمة الحوار الموجهة نحو المهام، تميل أساليب تتبع حكومية الحوار الحديثة إلى أداء جيل تمرير واحد من حالة الحوار بناء على حالة الحوار السابقة. أخطاء هذه النماذج التي تم إجراؤها بدورها الحالي عرضة للنقل إلى المنعطف التالي، مما تسبب في نشر الأخطاء. في هذه الورقة، نقترح إنشاء جيل محدد للجانبين لتتبع حالة الحوار (AG-DST)، والذي يحتوي على عملية توليد تمريرة اثنين: (1) إنشاء حالة حوار بدائية تستند إلى حوار المنعطف الحالي ودولة الحوار السابقة و (2) تعديل حالة الحوار البدائي من المرور الأول. مع مرور الجيل المعدل الإضافي، يتم تكمل نموذجنا لمعرفة المزيد من تعقب حالة الحوار القوية من خلال تعديل الأخطاء التي لا تزال موجودة في حالة الحوار البدائية، والتي تلعب دور إعادة النظر في عملية الفحص المزدوج وتغطي بعد انتشار الأخطاء غير الضرورية. تظهر النتائج التجريبية أن AG-DST تتفوق بشكل كبير على الأعمال السابقة في مجموعة بيانات DST النشطة (MultiWoz 2.2 و Woz 2.0)، وتحقيق عروض جديدة من بين الفنون.
نماذج تتبع حكومية الحوار تلعب دورا مهما في نظام حوار موجه نحو المهام.ومع ذلك، فإن معظمهم يصطادون أنواع الفتحات بشكل مشروط بإدخال المدخلات بشكل مشروط.نكتشف أنه قد يتسبب في الخلط النموذج من خلال أنواع الفتحات التي تشترك في نفس نوع البيانات.لتخفيف هذه ا لمشكلة، نقترح Trippy-MRF و Trippy-LSTM النماذج التي تطرح الفتحات بشكل مشترك.تظهر نتائجنا أنهم قادرون على تخفيف الارتباك المذكور أعلاه، ويدفعون الحديث في DataSet MultiWoz 2.1 من 58.7 إلى 61.3.
يتيح لنا إلينا التعلم عن تحويل طلقة الصفر لتتبع الدولة للحوار (DST) التعامل مع مجموعة متنوعة من مجالات الحوار الموجهة نحو المهام دون حساب جمع البيانات داخل المجال. في هذا العمل، نقترح نقل المعرفة عبر المهام من السؤال العام إجابة Corporing (QA) من أجل مهمة DST الصفرية. على وجه التحديد، نقترح TransforeQA، نموذج QA المولد القابل للتحويل يجمع بسلاسة بين QA الاستخراجية وجهاز QA متعدد الخيارات عبر إطار محول نص إلى نص، وتتبع كل من الفتحات الفئوية والفخات غير القشرية في DST. بالإضافة إلى ذلك، نقدم طريقتين فعاليتين لبناء أسئلة غير مرغوب فيها، أي أخذ عينات السؤال السلبية واقتطار السياق، مما تمكن نموذجنا للتعامل مع فتحات أي قيمة في إعداد DST الصفر. تشير التجارب الواسعة إلى أن نهجنا تحسن بشكل كبير من تسديدة صفرية القائمة وعدد قليل من النتائج على MultiWoz. علاوة على ذلك، مقارنة مع الأساس المدربين تدريبا كاملا في مجموعة بيانات الحوار الموجهة للمخطط، فإن نهجنا يظهر قدرة أفضل تعميم في المجالات غير المرئية.
تمكين أنظمة حوار المجال المفتوح لطرح أسئلة توضيحية عند الاقتضاء هو اتجاه مهم لتحسين جودة استجابة النظام.وهي، بالنسبة للحالات عندما يكون طلب المستخدم غير محددا لنظام محادثة لتوفير إجابة على الفور، فمن المستحسن طرح سؤال توضيحي لزيادة فرص استرداد إجابة مرضية.لمعالجة مشكلة توضيح الأسئلة في الحوارات المفتوحة في الحوارات ": (1) نجمع وتحرير مجموعة بيانات جديدة تركز على المحادثات المفتوحة ومتعددة الدورات، (2) نحن معيارا عدة حالاتخطوط الأساس العصبية الفن، و (3) نقترح خط أنابيب يتكون من خطوات غير متصلة بالإنترنت وعلى الإنترنت لتقييم جودة توضيح الأسئلة في حوارات مختلفة.هذه المساهمات مناسبة كمؤسسة لمزيد من البحث.
يقتصر معظم العمل المسبق على أنظمة الحوار الموجهة نحو المهام على دعم واجهات برمجة التطبيقات في المجال.ومع ذلك، قد يكون لدى المستخدمين طلبات خارج نطاق واجهات برمجة التطبيقات هذه.يركز هذا العمل على تحديد طلبات المستخدمين هذه.تعتمد الطرق الحالية لهذه الم همة بشكل أساسي على النماذج المدربة مسبقا بشكل صحيح على البيانات المشروحة الكبيرة.نقترح طريقة رواية، ريد، بناء على تقدير التعلم والكثافة التكيفية.يمكن تطبيق Rede على حالات الطابع الصفرية، ويتدرك بسرعة كاشف عالية الأداء مع بعض الطلقات فقط عن طريق تحديث أقل من المعلمات 3K.نوضح أداء Rede التنافسي في بيانات DSTC9 ومجموعة اختبار مجمعة حديثا.
أظهرت نماذج المحادثة العصبية إمكانات كبيرة تجاه توليد ردود بطلاقة وإمعلومات عن طريق إدخال معرفة خلفية خارجية. ومع ذلك، فمن الشائع بناء هذه الحوارات المدرجة في المعرفة، وعادة ما تؤدي النماذج الحالية بشكل سيء عند النقل إلى مجالات جديدة مع عينات تدريب م حدودة. لذلك، فإن بناء نظام حوار مدرج في المعرفة بموجب إعداد الموارد المنخفضة هو قضية حاسمة لا تزال. في هذه الورقة، نقترح إطارا لتعليم تعليمي رواية ثلاث مراحل يستند إلى التعلم الإشرافه ضعيف يفيد من الحوارات على نطاق واسع وقاعدة المعرفة غير المنظمة. للتعاون بشكل أفضل مع هذا الإطار، نضع متغير من المحولات مع فك فك التشفير التي تسهل التعلم المنطلق لتوليد الاستجابة وإدماج المعرفة. تشير نتائج التقييم إلى معيارين إلى أن نهجنا يمكن أن يتفوق على أساليب حديثة أخرى مع بيانات تدريب أقل، وحتى في سيناريو الموارد الصفرية، فإن نهجنا لا يزال ينفذ جيدا.
قد يساعد نظام حوار موجه نحو المهام مع التكيف مع شخصية المستخدم بشكل كبير تحسين أداء مهمة الحوار. ومع ذلك، يمكن أن يكون مثل هذا نظام الحوار صعبة عمليا للتنفيذ، لأنه من غير الواضح كيف تؤثر شخصية المستخدم على أداء مهمة الحوار. لاستكشاف العلاقة بين شخصية المستخدم وأداء مهمة الحوار، سجلنا المشاركين عبر الجماعة الجماعية للإجابة الأولى على استبيانات الشخصية المحددة ثم الدردشة مع نظام حوار لإنجاز المهام المعينة. تم استخدام نظام حوار يستند إلى القواعد في مهمة Wizard-of-of-of-of-of-of-of-of-of-of-ofoz (Multioz) السائدة. تم جمع وتحليل وتحليل وتحليل وتحليلها ما مجموعه 211 شخصي مشاركين وحوارات 633. كشفت النتائج أن الأشخاص المؤنسين والمنفتحين يميلون إلى فشل المهمة، في حين أن الناس العصبي كانوا أكثر عرضة للنجاح. استخرجنا الميزات المتعلقة بسلوكيات حوار المستخدم وأداء تحليل آخر لتحديد أي نوع من السلوك يؤثر على أداء المهام. ونتيجة لذلك، حددنا أن متوسط ​​طول الكلام والانفجارات لكل كلام هي الملامح الرئيسية لسلوك الحوار مرتبطة بشدة مع كل من أداء المهام وشخصية المستخدم.
لقد أثبت العمل الحديث في وكلاء المحادثة المفتوحة على أن التحسينات الكبيرة في الإنسانية وتفضيل المستخدم يمكن تحقيقها عبر التحجيم الضخم في كل من بيانات التدريب المسبق وحجم النموذج (Adiwardana et al.، 2020؛ الأسطوانة وآخرون، 2020). ومع ذلك، إذا كنا نريد بناء عملاء مع قدرات تشبه الإنسان، يجب علينا توسيع نطاق التعامل مع النص فقط. موضوع مهم للغاية هو القدرة على رؤية الصور والتواصل حول ما ينظر إليه. بهدف الحصول على البشر للانخراط في حوار متعدد الوسائط، نحقق في مجمع المكونات من وكلاء حوار الوكالة المفتوحة للحكومة من بين الفنون من نماذج الرؤية الحديثة. نحن ندرس دمج مخططات مختلفة من صور الصور واستراتيجيات التدريب المسبق على نطاق واسع على المجال وضبط النطاق، وتظهر أن طرازنا الأفضل الناتج يفوق النماذج الحالية القوية في حوار متعدد الوسائط أثناء التنفيذ في وقت واحد وكذلك سلفها (النص فقط) (الأسطوانة وآخرون، 2020) في محادثة قائمة على النص. إننا كذلك تحقيق وإدماج مكونات السلامة في نموذجنا النهائي، وإظهار أن هذه الجهود لا تقلل من الأداء النموذجي فيما يتعلق بتفضيل الإنسان.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا