ترغب بنشر مسار تعليمي؟ اضغط هنا

المعرفة - علم الرسم البياني GPT-2 المحسن لتتبع حالة الحوار

Knowledge-Aware Graph-Enhanced GPT-2 for Dialogue State Tracking

657   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعد تتبع ولاية الحوار مركزيا لأنظمة الحوار الموجهة نحو المهام متعددة المجالات، مسؤولة عن استخراج المعلومات من كلام المستخدمين.نقدم هندسة هجينة جديدة تعزز GPT-2 مع التمثيلات المستمدة من شبكات اهتمام الرسوم البيانية بطريقة تسمح بالتنبؤ السببية والتسلسل لقيم الفتحة.يجسد الهندسة المعمارية النموذجية العلاقات بين الفتحات والتبعية عبر المجالات التي يمكن أن تضيع خلاف ذلك في التنبؤ المتسلسل.نبلغ عن التحسينات في أداء تتبع الدولة في MultiWoz 2.0 مقابل خط الأساس GPT-2 قوي والتحقيق في سيناريو تدريب متقطع مبسط يتم تدريب نماذج DST فقط على التعليقات التوضيحية على مستوى الجلسة ولكن تم تقييمها عند مستوى الدوران.نبلغ أيضا عن تحليلات مفصلة لإظهار فعالية نماذج الرسوم البيانية في DST من خلال إظهار أن وحدات الرسم البياني المقترح تلتقط التبعيات بين الفتحات وتحسين تنبؤات القيم الشائعة في مجالات متعددة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في أنظمة الحوار الموجهة نحو المهام، تميل أساليب تتبع حكومية الحوار الحديثة إلى أداء جيل تمرير واحد من حالة الحوار بناء على حالة الحوار السابقة. أخطاء هذه النماذج التي تم إجراؤها بدورها الحالي عرضة للنقل إلى المنعطف التالي، مما تسبب في نشر الأخطاء. في هذه الورقة، نقترح إنشاء جيل محدد للجانبين لتتبع حالة الحوار (AG-DST)، والذي يحتوي على عملية توليد تمريرة اثنين: (1) إنشاء حالة حوار بدائية تستند إلى حوار المنعطف الحالي ودولة الحوار السابقة و (2) تعديل حالة الحوار البدائي من المرور الأول. مع مرور الجيل المعدل الإضافي، يتم تكمل نموذجنا لمعرفة المزيد من تعقب حالة الحوار القوية من خلال تعديل الأخطاء التي لا تزال موجودة في حالة الحوار البدائية، والتي تلعب دور إعادة النظر في عملية الفحص المزدوج وتغطي بعد انتشار الأخطاء غير الضرورية. تظهر النتائج التجريبية أن AG-DST تتفوق بشكل كبير على الأعمال السابقة في مجموعة بيانات DST النشطة (MultiWoz 2.2 و Woz 2.0)، وتحقيق عروض جديدة من بين الفنون.
تعكس العلاقات في معظم الرسوم البيانية المعارف التقليدية (KGS) فقط الاتصالات الثابتة والواقعية، ولكنها تفشل في تمثيل الأنشطة الديناميكية وتغير الدولة حول الكيانات. في هذه الورقة، نؤكد على أهمية دمج الأحداث في تعلم تمثيل KG، واقتراح نموذج Eventke Event ke Eventke المحسن للحدث. على وجه التحديد، نظرا لل KG الأصلية، فإننا ندمج أول عقود حدث من خلال بناء شبكة غير متجانسة، حيث يتم توزيع العقد الكيانية وعقد الحدث على جانبي الشبكة بين روابط الوسيطة في الحدث. ثم نستخدم علاقات كيان الكيان من الروابط الزمنية KG والأحداث الزمنية الأصلية إلى الكيان والكيان الداخلي والوقت على التوالي. نقوم بتصميم طريقة تمرير رسائل مفيدة وتستند إلى الرواية، والتي يتم إجراؤها على كيان كيان وكيان الحدث وحدث الأحداث لفيد معلومات الحدث في AGBeddings KG. تظهر النتائج التجريبية على مجموعات البيانات في العالم الحقيقي أن الأحداث يمكن أن تحسن إلى حد كبير جودة AGEDDINGS KG على مهام متعددة المصب.
تعد تتبع ولاية الحوار (DST) مهمة فرعية لأنظمة الحوار القائمة على المهام حيث يتم تتبع نية المستخدم من خلال ثلاثة أضعاف ثلاثة ثلاث مرات يمكن أن يكون من الصعب تمديد طرازات DST الحالية لمجموعات بيانات جديدة مع مجالات / فتحات أكبر ترجع أساسا إلى أي من الس ببين - 1) تنبؤ فتحة المجال كزوج، والثاني) تبعية المعلمات النموذجية على عدد الفتحات والمجالات وبعد في هذا العمل، نقترح معالجة هذه المشكلات باستخدام نموذج DST الهرمي (Hi-DS). بدور معين، يكتشف النموذج أولا تغيير في المجال متبوعا بتنبؤ المجال إذا لزم الأمر. ثم تقرر إجراء مناسب لكل فتحة في المجالات المتوقعة ويجد قيمتها وفقا لذلك. المعلمات النموذجية ل HI-DST مستقلة عن عدد المجالات / الفتحات. نظرا للنمذجة الهرمية، فإنه يحقق O (| M | + | N |) تنبؤ الدولة المعتقد بدوره واحد حيث M و N هي مجموعة من المجالات الفريدة والفتحات على التوالي. نقول أن الهيكل الهرمي يساعد في نموذج الشرح ويجعله قابل للتوسيع بسهولة إلى مجموعات بيانات جديدة. تشير التجارب في مجموعة بيانات MultiWoz إلى أن نموذجنا المقترح يحقق أداء دقة مشتركة قابلة للمقارنة بنماذج DST الحديثة.
يعمل العمل المسبق على جيل البيانات إلى النص، ومهمة تحويل الكلام الرسم البياني (KG) ثلاث مرات إلى نص طبيعي، يركز على مجموعات البيانات القياسية الخاصة بالمجال. ومع ذلك، في هذه الورقة، فإننا ننفذنا اللغة الإنجليزية بأكملها Wikidata KG، ومناقشة التحديات الفريدة المرتبطة بمجال واسع ومجموع واسع النطاق. نوضح كذلك بأنه لفظي كجم شامل ومكون من كجم مثل Wikidata يمكن استخدامه لدمج KGS الهيكلية واللغات الطبيعية. على عكس العديد من البنيات التي تم تطويرها لدمج هاتين المصدرين، فإن نهجنا يحول كجم إلى نص طبيعي، مما يسمح له بالدمج بسلاسة في نماذج اللغة الحالية. إنه يحمل مزايا أخرى لتحسين الدقة الواقعية وتقليل السمية في نموذج اللغة الناتج. نقوم بتقييم هذا النهج عن طريق زيادة عملية استرجاع النموذج لغوي استرجاع وإظهار تحسينات كبيرة على مهام المعرفة المكثفة في المجال المفتوح وكثير المعرفة LAMA.
تتبع مجردة تتبع حوار الحوار لتحسين تفسير أهداف المستخدم وتغذية التعلم السياسي المصب هو عنق الزجاجة في إدارة الحوار.كانت الممارسة الشائعة تعاملها كمشكلة تصنيف محتوى الحوار في مجموعة من أزواج القيمة ذات القيمة المحددة مسبقا، أو توليد قيم لفات مختلفة با لنظر إلى سجل الحوار.كلاهما لديه قيود على النظر في التبعيات التي تحدث على الحوارات، وتفتقر إلى قدرات التفكير.تقترح هذه الورقة تتبع حوار الحوار تدريجيا مع المنطق حول الحوار يتحول بمساعدة البيانات الخلفية.توضح النتائج التجريبية أن أسلوبنا تتفوق على الأساليب الحديثة من حيث الدقة المعتقدات المشتركة ل MultiWoz 2.1، ومجموعة بيانات حوار بشرية على نطاق واسع عبر مجالات متعددة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا