ترغب بنشر مسار تعليمي؟ اضغط هنا

اكتساب تجربة مع البيانات المهيكلة: استخدام موارد تحدي تتبع ولاية الحوار 2

Gaining Experience with Structured Data: Using the Resources of Dialog State Tracking Challenge 2

56   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توضح هذه الورقة مشروعا فئة لدورة المرحلة الجامعية المرحلة الجامعية تم تقديمها مؤخرا يمنح طلاب علوم الكمبيوتر الفرصة لاستكشاف بيانات تحدي تتبع ولاية الحوار 2 (DSTC 2).تمت مناقشة خلفية الطلاب وخيارات المناهج الدراسية وتفاصيل المشروع.تختتم الورقة مع بعض المشورة المدرس والانعكاسات النهائية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تتبع مجردة تتبع حوار الحوار لتحسين تفسير أهداف المستخدم وتغذية التعلم السياسي المصب هو عنق الزجاجة في إدارة الحوار.كانت الممارسة الشائعة تعاملها كمشكلة تصنيف محتوى الحوار في مجموعة من أزواج القيمة ذات القيمة المحددة مسبقا، أو توليد قيم لفات مختلفة با لنظر إلى سجل الحوار.كلاهما لديه قيود على النظر في التبعيات التي تحدث على الحوارات، وتفتقر إلى قدرات التفكير.تقترح هذه الورقة تتبع حوار الحوار تدريجيا مع المنطق حول الحوار يتحول بمساعدة البيانات الخلفية.توضح النتائج التجريبية أن أسلوبنا تتفوق على الأساليب الحديثة من حيث الدقة المعتقدات المشتركة ل MultiWoz 2.1، ومجموعة بيانات حوار بشرية على نطاق واسع عبر مجالات متعددة.
غالبا ما تستخدم أنظمة المحادثة الموجهة نحو المهام تتبع حالة الحوار لتمثيل نوايا المستخدم، والتي تنطوي على ملء قيم فتحات محددة مسبقا.تم اقتراح العديد من النهج، وغالبا ما تستخدم الهندسة المعنية بمهام المهام مع مصنفات ذات الأغراض الخاصة.في الآونة الأخير ة، تم الحصول على نتائج جيدة باستخدام هياكل عامة أكثر بناء على نماذج اللغة المحددة مسبقا.هنا، نقدم اختلافا جديدا لنهج نمذجة اللغة التي تستخدم مطالبة مخطط مدفوعة بتوفير ترميز التاريخ على علم المهام المستخدمة لكل من الفتحات الفئوية وغير القشرية.ونحن كذلك تحسين الأداء من خلال زيادة المطالبة بأوصاف المخطط، وهو مصدر حدوث طبيعي للمعرفة داخل المجال.لدينا نظام التوليد البحت يحقق الأداء الحديثة في MultiWoz 2.2 وتحقق أداء تنافسي على اثنين من المعايير الأخرى: MultiWoz 2.1 و M2M.ستكون البيانات والرمز متاحة في https://github.com/chiahsuan156/dst-as-prompting.
في الآونة الأخيرة، تم توسيع تركيز تتبع حالة الحوار من مجال واحد إلى مجالات متعددة.تتميز المهمة بالفتحات المشتركة بين المجالات.نظرا لأن السيناريو يحصل على مزيد من المعقدة، تصبح مشكلة خارج المفردات أيضا شارما.النماذج الحالية ليست مرضية لحل تحديات تكامل الأطباق بين المجالات ومشاكل خارج المفردات.لمعالجة المشكلة، نستكشف الدلالية الهرمية من علم الأطباق ويعزز العلاقة بين الفتحات ذات الاهتمام الهرمي الملثم.في مرحلة فك قيمة الدولة، نحل المشكلة خارج المفردات من خلال الجمع بين طريقة التوليد وطريقة الاستخراج معا.نقيم أداء نموذجنا على مجموعة بيانات تمثيلية، MultiWoz باللغة الإنجليزية والكنيسة في الصينية.تظهر النتائج أن طرازنا يجرض مكسب أداء كبير على طراز تتبع الدولة الحديثة الحالية وهو أكثر قوة لمشكلة خارج المفردات مقارنة بالطرق الأخرى.
تعد تتبع ولاية الحوار مركزيا لأنظمة الحوار الموجهة نحو المهام متعددة المجالات، مسؤولة عن استخراج المعلومات من كلام المستخدمين.نقدم هندسة هجينة جديدة تعزز GPT-2 مع التمثيلات المستمدة من شبكات اهتمام الرسوم البيانية بطريقة تسمح بالتنبؤ السببية والتسلسل لقيم الفتحة.يجسد الهندسة المعمارية النموذجية العلاقات بين الفتحات والتبعية عبر المجالات التي يمكن أن تضيع خلاف ذلك في التنبؤ المتسلسل.نبلغ عن التحسينات في أداء تتبع الدولة في MultiWoz 2.0 مقابل خط الأساس GPT-2 قوي والتحقيق في سيناريو تدريب متقطع مبسط يتم تدريب نماذج DST فقط على التعليقات التوضيحية على مستوى الجلسة ولكن تم تقييمها عند مستوى الدوران.نبلغ أيضا عن تحليلات مفصلة لإظهار فعالية نماذج الرسوم البيانية في DST من خلال إظهار أن وحدات الرسم البياني المقترح تلتقط التبعيات بين الفتحات وتحسين تنبؤات القيم الشائعة في مجالات متعددة.
تم تطبيق نماذج التسلسل إلى التسلسل على مجموعة واسعة من مهام NLP، ولكن كيفية استخدامها بشكل صحيح لتتبع حالة الحوار بشكل منهجي. في هذه الورقة، ندرس هذه المشكلة من وجهات نظر أهداف ما قبل التدريب وكذلك تنسيقات تمثيلات السياق. نوضح أن اختيار الهدف ما قبل التدريب يجعل فرقا كبيرا لجودة تتبع الدولة. على وجه الخصوص، نجد أن التنبؤ الأمان المقنع هو أكثر فعالية من نمذجة اللغة التراجع التلقائي. نستكشف أيضا استخدام Pegasus، وهو هدف ما قبل التدريب المستندة إلى التنبؤ بتلخيص النص، لنموذج تتبع الدولة. وجدنا أن التدريب المسبق لمهمة التلخيص البعيدة على ما يبدو يعمل بشكل جيد بشكل جيد لتتبع حالة الحوار. بالإضافة إلى ذلك، وجدنا أنه في حين أن تمثيل سياق الدولة المتكرر يعمل أيضا بشكل جيد بشكل معقول، فقد يكون للنموذج صعوبة في التعافي من الأخطاء السابقة. أجرينا تجارب في مجموعات بيانات MultiWoz 2.1-2.4 و Woz 2.0 و DSTC2 مع ملاحظات متسقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا