ترغب بنشر مسار تعليمي؟ اضغط هنا

تكبير استرجاع تقلل من الهلوسة في المحادثة

Retrieval Augmentation Reduces Hallucination in Conversation

181   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

على الرغم من إظهار قدرات محادثة مثيرة تشبه الإنسان بشكل متزايد، غالبا ما تعاني نماذج الحوار الحديثة من التصحيح الواقعي وحلوي المعرفة (الأسطوانة وآخرون، 2020). في هذا العمل، نستكشف استخدام هياكل الاسترجاع العصبي - التي تظهر مؤخرا لتكون فعالة في الجودة المفتوحة QA (لويس وآخرون، 2020B؛ Izacard and Grav، 2020) - للحصول على الحوار المعرفي، مهمة يمكن القول أنها أكثر تحديا لأنها تتطلب الاستئصال بناء على سياق الحوار متعدد الدورات المعقدة وإنشاء ردود متماسكة للمحادثة. نحن ندرس أنواعا مختلفة من الهندسة مع مكونات متعددة - المستردون والراحة، وكشف ترميز التشفير - بهدف تعظيم قابلية الإصلاحية أثناء الاحتفاظ بقدرة المحادثة. نوضح أن أفضل النماذج لدينا تحصل على أداء حديثة في مهام المحادثة المدرجة في المعرفة. تعرض النماذج إمكانات محادثة في المجال المفتوح، وتعميم بفعالية من السيناريوهات غير ضمن بيانات التدريب، وعلى النحو الذي تم التحقق منه من خلال التقييمات البشرية، يقلل بشكل كبير من المشكلة المعروفة من الهلوسة المعرفة في Statbots الحديثة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في التطبيقات العملية للجدل الدلالي، نريد في كثير من الأحيان تغيير سلوك المحلل بسرعة، مثل تمكينه من التعامل مع الاستعلامات في مجال جديد، أو تغيير تنبؤاتها على بعض الاستفسارات المستهدفة. على الرغم من أنه يمكننا إدخال أمثلة تدريبية جديدة تظهر السلوك الم ستهدف، فإن آلية سن تغييرات السلوكية دون إعادة تدريب طراز باهظ الثمن سيكون أفضل. تحقيقا لهذه الغاية، نقترح المحلل الدلالي القابل للتحكم عبر استرجاع Exemplar (Casper). نظرا لاستعلام المدخلات، يسترد المحلل تحليل الخرزات ذات الصلة من مؤشر استرجاع، ويعززها إلى الاستعلام، ثم يطبق نموذج SEQ2SEQ Generative لإنتاج تحليل إخراج. تعمل EXEMPLARS كآلية مراقبة على النموذج العام العام: من خلال معالجة مؤشر الاسترجاع أو كيفية إنشاء الاستعلام المعزز، يمكننا معالجة سلوك المحلل المحلل. على مجموعة بيانات MTOP، بالإضافة إلى تحقيق أحدث من الفن في الإعداد القياسي، نظهر أن كاسبر يمكن أن تحليل الاستعلامات في مجال جديد، أو تكييف التنبؤ باتجاه الأنماط المحددة، أو التكيف مع مخططات الدلالات الجديدة دون الحاجة إلى الحاجة إلى مزيد من إعادة تدريب النموذج.
أظهرت التقدم المحدد في استخدام مكونات الاسترجاع على مصادر المعرفة الخارجية نتائج رائعة لمجموعة متنوعة من المهام المصب في معالجة اللغة الطبيعية.هنا، نستكشف استخدام مصادر المعرفة الخارجية غير منتهية للصور وتستياؤها المقابلة لتحسين الإجابة على السؤال ال مرئي (VQA).أولا، نحن ندرب نموذج محاذاة جديدة لتضمين الصور والتعليقات التوضيحية في نفس الفضاء، والذي يحقق تحسنا كبيرا في الأداء على استرجاع التعليق على الصورة W.r.T.طرق مماثلة.ثانيا، نظهر أن المحولات متعددة الوسائط متعددة الاسترجاع باستخدام نموذج المحاذاة المدربين يحسن النتائج على VQA عبر خطوط خطوط خطوط خطوط خطوط خطوط خطوط خطوط خطوط طويلة.كلنا إجراء تجارب مكثفة لإثبات وعد هذا النهج، وفحص طلبات جديدة لوقت الاستدلال مثل مؤشرات التبديلات الساخنة.
المحادثات عبر الإنترنت يمكن أن تأخذ في بعض الأحيان دورا للأسوأ، إما بسبب الاختلافات الثقافية المنهجية أو سوء الفهم العرضي أو مجرد خبث.تتوقع الانحراف المتوقع تلقائيا في المحادثات العامة على الإنترنت يوفر فرصة للقيام بالإجراءات المبكرة إلى معتدلة.العمل السابق في هذا الفضاء محدود، وتمديده بعدة طرق.نحن نطبق تشفير اللغة المحددة مسبقا للمهمة، والتي تتفوقت على النهج السابقة.سنقوم بمزيد من التجربة مع تحويل نموذج التدريب للمهمة من ثابت إلى ديناميكي واحد لزيادة الأفق التوقعات.يظهر هذا النهج نتائج مختلطة: في إعداد بيانات عالي الجودة، يمكن تحقيق أفق متوسط متوسط الأطول بتكلفة انخفاض صغير في F1؛في إعداد بيانات منخفضة الجودة، ومع ذلك، فإن التدريب الديناميكي ينشر الضوضاء وهو أمر ضار للغاية للأداء.
تميل أنظمة المحادثة التوليدية إلى إنتاج ردود لا معنى لها والأجنحة، والتي تقلل بشكل كبير من تجربة المستخدم. من أجل توليد ردود مفيدة ومتنوعة، اقترحت الدراسات الحديثة المعرفة لتحسين المعلوماتية وتعتمد المتغيرات الكامنة لتعزيز التنوع. ومع ذلك، فإن الاستف ادة من المتغيرات الكامنة ستؤدي إلى عدم دقة المعرفة في الاستجابات، ونشر المعرفة الخاطئة ستضلل المسؤولون. لمعالجة هذه المشكلة، نقترح شبكة مخدرة متنوعة من الناحية النحوية (SDAN) لنموذج المحادثة المدرجة المعرفة. يحتوي SDAN على شبكة دلالات هرمية ذات خصومة للحفاظ على التماسك الدلالي، وهي شبكة مدركة للمعرفة لحضور المعرفة الأكثر متعلقة بتحسين المعلومات والشبكة المتغيرة الكامنة النحوية لتوليد ردود متنوعة من الناحية النحوية. بالإضافة إلى ذلك، من أجل زيادة إمكانية التحكم في بناء الجملة، نعتمد التعلم الخصم لإزالة التمثيلات الدلالية والمنظمات. تظهر النتائج التجريبية أن طرازنا لا يمكن أن يؤدي فقط إلى تحقيق استجابات متنوعة ومتنوعة من المعرفة فقط ولكنها تحقق أيضا التوازن بين تحسين التنوع النحوي والحفاظ على دقة المعرفة.
على الرغم من الأداء الرائع للنماذج التوليدية واسعة النطاق في محادثة مفتوحة، من المعروف أنها أقل عملية لبناء أنظمة محادثة في الوقت الفعلي بسبب ارتفاع الكمون. من ناحية أخرى، يمكن أن تعيد نماذج استرجاع الردود بأشياء أقل بكثير ولكنها تظهر أداء أدنى للنما ذج الإدارية على نطاق واسع لأن جودة المحادثة تحدها مجموعة استجابة محددة مسبقا. للاستفادة من كلتا النهجين، نقترح طريقة تدريب جديدة تسمى G2R (التقطير الاسترجلي من الاسترجاع) التي تحافظ على كفاءة نموذج استرجاع مع الاستفادة من القدرة على التحدث نموذجا إيديا واسع النطاق عن طريق غرس المعرفة بالتوليد نموذج في نموذج الاسترجاع. تتكون G2R من تقنيتين متميزتين من التقطير: يعزز G2R على مستوى البيانات مجموعة بيانات الحوار مع ردود إضافية النموذج المولد النطاق، وينقل G2R على مستوى النموذج درجة جودة الاستجابة التي تم تقييمها بواسطة نموذج التوليد إلى درجة نموذج الاسترجاع عن طريق فقدان المعرفة في التقطير. من خلال تجارب واسعة بما في ذلك التقييم البشري، نوضح أن نظام المحادثة المستندة إلى استرجاعنا المدربين مع G2R يدل على أداء محسن بشكل كبير مقارنة بنموذج استرجاع الأساس أثناء إظهار زمن الاستدلال الأساسي بشكل كبير من النماذج الإدارية على نطاق واسع.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا