ترغب بنشر مسار تعليمي؟ اضغط هنا

تتبع حالة الحوار التسلسل الفعال

Effective Sequence-to-Sequence Dialogue State Tracking

186   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تم تطبيق نماذج التسلسل إلى التسلسل على مجموعة واسعة من مهام NLP، ولكن كيفية استخدامها بشكل صحيح لتتبع حالة الحوار بشكل منهجي. في هذه الورقة، ندرس هذه المشكلة من وجهات نظر أهداف ما قبل التدريب وكذلك تنسيقات تمثيلات السياق. نوضح أن اختيار الهدف ما قبل التدريب يجعل فرقا كبيرا لجودة تتبع الدولة. على وجه الخصوص، نجد أن التنبؤ الأمان المقنع هو أكثر فعالية من نمذجة اللغة التراجع التلقائي. نستكشف أيضا استخدام Pegasus، وهو هدف ما قبل التدريب المستندة إلى التنبؤ بتلخيص النص، لنموذج تتبع الدولة. وجدنا أن التدريب المسبق لمهمة التلخيص البعيدة على ما يبدو يعمل بشكل جيد بشكل جيد لتتبع حالة الحوار. بالإضافة إلى ذلك، وجدنا أنه في حين أن تمثيل سياق الدولة المتكرر يعمل أيضا بشكل جيد بشكل معقول، فقد يكون للنموذج صعوبة في التعافي من الأخطاء السابقة. أجرينا تجارب في مجموعات بيانات MultiWoz 2.1-2.4 و Woz 2.0 و DSTC2 مع ملاحظات متسقة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تتبع مجردة تتبع حوار الحوار لتحسين تفسير أهداف المستخدم وتغذية التعلم السياسي المصب هو عنق الزجاجة في إدارة الحوار.كانت الممارسة الشائعة تعاملها كمشكلة تصنيف محتوى الحوار في مجموعة من أزواج القيمة ذات القيمة المحددة مسبقا، أو توليد قيم لفات مختلفة با لنظر إلى سجل الحوار.كلاهما لديه قيود على النظر في التبعيات التي تحدث على الحوارات، وتفتقر إلى قدرات التفكير.تقترح هذه الورقة تتبع حوار الحوار تدريجيا مع المنطق حول الحوار يتحول بمساعدة البيانات الخلفية.توضح النتائج التجريبية أن أسلوبنا تتفوق على الأساليب الحديثة من حيث الدقة المعتقدات المشتركة ل MultiWoz 2.1، ومجموعة بيانات حوار بشرية على نطاق واسع عبر مجالات متعددة.
يتيح لنا إلينا التعلم عن تحويل طلقة الصفر لتتبع الدولة للحوار (DST) التعامل مع مجموعة متنوعة من مجالات الحوار الموجهة نحو المهام دون حساب جمع البيانات داخل المجال. في هذا العمل، نقترح نقل المعرفة عبر المهام من السؤال العام إجابة Corporing (QA) من أجل مهمة DST الصفرية. على وجه التحديد، نقترح TransforeQA، نموذج QA المولد القابل للتحويل يجمع بسلاسة بين QA الاستخراجية وجهاز QA متعدد الخيارات عبر إطار محول نص إلى نص، وتتبع كل من الفتحات الفئوية والفخات غير القشرية في DST. بالإضافة إلى ذلك، نقدم طريقتين فعاليتين لبناء أسئلة غير مرغوب فيها، أي أخذ عينات السؤال السلبية واقتطار السياق، مما تمكن نموذجنا للتعامل مع فتحات أي قيمة في إعداد DST الصفر. تشير التجارب الواسعة إلى أن نهجنا تحسن بشكل كبير من تسديدة صفرية القائمة وعدد قليل من النتائج على MultiWoz. علاوة على ذلك، مقارنة مع الأساس المدربين تدريبا كاملا في مجموعة بيانات الحوار الموجهة للمخطط، فإن نهجنا يظهر قدرة أفضل تعميم في المجالات غير المرئية.
نماذج تتبع حكومية الحوار تلعب دورا مهما في نظام حوار موجه نحو المهام.ومع ذلك، فإن معظمهم يصطادون أنواع الفتحات بشكل مشروط بإدخال المدخلات بشكل مشروط.نكتشف أنه قد يتسبب في الخلط النموذج من خلال أنواع الفتحات التي تشترك في نفس نوع البيانات.لتخفيف هذه ا لمشكلة، نقترح Trippy-MRF و Trippy-LSTM النماذج التي تطرح الفتحات بشكل مشترك.تظهر نتائجنا أنهم قادرون على تخفيف الارتباك المذكور أعلاه، ويدفعون الحديث في DataSet MultiWoz 2.1 من 58.7 إلى 61.3.
تهدف هذه الورقة إلى تقديم نظرة عامة شاملة للتطورات الأخيرة في تتبع حكمة الحوار (DST) لأنظمة المحادثات الموجهة نحو المهام.نقدم المهمة، وخاصة البيانات الرئيسية التي تم استغلالها وكذلك مقاييس تقييمها، ونحن نحلل العديد من النهج المقترحة.نحن نميز بين نماذ ج DST غير الثابتة، والتي تتنبأ بمجموعة ثابتة من دول الحوار، ونماذج الأطباق الديناميكية، والتي يمكن أن تتنبؤ حوار الحوار حتى عندما تتغير عملية الأونولوجيا.ونناقش أيضا قدرة النموذج على تتبع النطاقات الفردية أو المتعددة والقياس إلى مجالات جديدة، سواء من حيث نقل المعرفة والتعلم الصفر.نحن نغطي فترة من عام 2013 إلى 2020، مما يدل على زيادة كبيرة في أساليب مجال متعددة، ومعظمها باستخدام نماذج اللغة المدربة مسبقا.
في الآونة الأخيرة، تم توسيع تركيز تتبع حالة الحوار من مجال واحد إلى مجالات متعددة.تتميز المهمة بالفتحات المشتركة بين المجالات.نظرا لأن السيناريو يحصل على مزيد من المعقدة، تصبح مشكلة خارج المفردات أيضا شارما.النماذج الحالية ليست مرضية لحل تحديات تكامل الأطباق بين المجالات ومشاكل خارج المفردات.لمعالجة المشكلة، نستكشف الدلالية الهرمية من علم الأطباق ويعزز العلاقة بين الفتحات ذات الاهتمام الهرمي الملثم.في مرحلة فك قيمة الدولة، نحل المشكلة خارج المفردات من خلال الجمع بين طريقة التوليد وطريقة الاستخراج معا.نقيم أداء نموذجنا على مجموعة بيانات تمثيلية، MultiWoz باللغة الإنجليزية والكنيسة في الصينية.تظهر النتائج أن طرازنا يجرض مكسب أداء كبير على طراز تتبع الدولة الحديثة الحالية وهو أكثر قوة لمشكلة خارج المفردات مقارنة بالطرق الأخرى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا