ترغب بنشر مسار تعليمي؟ اضغط هنا

الحصول على الاستجابة العاطفية هي خطوة رئيسية في بناء نظم الحوار التعاطفية. تمت دراسة هذه المهمة كثيرا في Chatbots القائمة على الجيل، ولكن البحوث ذات الصلة في chatbots القائمة على الاسترجاع لا تزال في المرحلة المبكرة. تستند الأعمال الموجودة في Chatbot s المستندة إلى الاسترجاع إلى إطار استرداد Rerank-Rerank، والتي لها مشكلة مشتركة تؤثر على التسمية على حساب جودة الاستجابة. لمعالجة هذه المشكلة، نقترح إطارا بسيطا وفعالا - إعادة الكتابة - إعادة الكتابة. يحل الإطار محل آلية إعادة النشر مع آلية جديدة للتمييز وإعادة الكتابة، والذي يتنبأ بتسمية التأثير على الاستجابة عالية الجودة المستردة من خلال وحدة التمييز ومواصلة إعادة كتابة الاستجابة غير الراضية عبر وحدة إعادة كتابة. هذا لا يمكن أن يضمن فقط جودة الاستجابة، ولكن أيضا تلبية علامة التأثير المحددة. بالإضافة إلى ذلك، فإن التحدي الآخر لهذا السطر البحث هو عدم وجود مجموعة بيانات استجابة عاطفية خارج الرف. لمعالجة هذه المشكلة واختبار إطار عملنا المقترح، سنلقيطر على كوربوس محادثة Douban Sentemental بناء على Corpus الأصلي Doubban Corpus. تظهر النتائج التجريبية أن إطار عملنا المقترح فعال وتفوق خطوط أساس تنافسية.
يظهر التطوير الحديث في NLP اتجاها قويا نحو تكرير النماذج المدربة مسبقا مع مجموعة بيانات خاصة بالمجال. هذا هو الحال بشكل خاص لتوليد الاستجابة حيث تلعب العاطفة دورا مهما. ومع ذلك، لا تزال مجموعات البيانات المتعاطفية الحالية صغيرة وتأخير الجهود البحثية في هذا المجال، على سبيل المثال، تطوير Chatement-Aware Chatbots. كان التحدي الفني الرئيسي واحد هو تكلفة التسجيل يدويا الحوارات مع ملصقات العاطفة المناسبة. في هذه الورقة، نصف مجموعة بيانات فضية واسعة النطاق تتكون من حوارات من 1M المشروح ب 32 عواطف دقيقة، وثمانية نوايا استجابة متعاطفية، والفئة المحايدة. لتحقيق هذا الهدف، قمنا بتطوير خط أنابيب لجنة البيانات الرواية بدءا من بذرة صغيرة من البيانات المشروحة يدويا وتوسيع نطاقها في نهاية المطاف إلى حجم مرض. قمنا بمقارنة جودةها مقابل مجموعة بيانات ذهبية أحدث باستخدام كل من التجارب دون اتصال وطرائق التحقق من الصحة. يمكن استخدام الإجراء الناتج لإنشاء مجموعات بيانات مماثلة في نفس المجال وكذلك في المجالات الأخرى.
تؤيد الأدلة الحديثة دورا للمعالجة الأساسية في توجيه التوقعات البشرية حول الكلمات القادمة أثناء القراءة، بناء على مخبأ بين أوقات القراءة والكلمة المفاجئة التي يقدرها نموذج المعالجة الدلالي المفيد (Jaffe et al. 2020). الدراسة الحالية تستنسخ وتطويرهافي هذا النتيجة (1) تمكين المحلل المحلل لمعالجة معلومات الكلمات الفرعية التي قد تقريب من المعرفة المورفولوجية البشرية بشكل أفضل، و (2) تمديد تقييم آثار COMERIAL من القراءة الذاتية لبيانات التصوير بالدماغ البشري.تشير النتائج إلى أن تأثير المعالجة القائم على التوقعات في كور معلومات لا يزال واضحا حتى في وجود خط الأساس النفسي القوي الذي يوفره نموذج الكلمة الفرعية، وأن تأثير comeference لوحظ في كل من بيانات القراءة والنفس ذاتي، وتوفير دليل علىتأثير متواضع.
أظهرت نماذج اختيار الاستجابة متعددة الدوران مؤخرا أداء مماثل للبشر في العديد من البيانات القياسية.ومع ذلك، في البيئة الحقيقية، غالبا ما تحتوي هذه النماذج على نقاط ضعف، مثل اتباع تنبؤات غير صحيحة تستند بشكل كبير على الأنماط السطحية دون فهم شامل للسياق .على سبيل المثال، غالبا ما تعطي هذه النماذج درجات عالية مرشحة للاستجابة الخاطئة التي تحتوي على العديد من الكلمات الرئيسية المتعلقة بالسياق ولكن باستخدام المضارع غير المتناقص.في هذه الدراسة، نقوم بتحليل نقاط الضعف في نماذج اختيار استجابة الاستجابة الكورية من هذا المجال ونشر مجموعة بيانات الخصومة لتقييم هذه نقاط الضعف.نقترح أيضا استراتيجية لبناء نموذج قوي في هذه البيئة الخصومة.
إن فهم مشاعر المتكلم وإنتاج الاستجابات المناسبة مع اتصال العاطفة هو مهارة متتالية رئيسية لأنظمة الحوار التعاطفية.في هذه الورقة، نقترح تقنية بسيطة تسمى فك الترميز العاطفي لتوليد الاستجابة المتعاطفة.يمكن أن تتضمن طريقةنا بفعالية إشارات العاطفة أثناء كل خطوة فك التشفير، ويمكن تقديمها بالإضافة إلى ذلك بتشمس العاطفة المزدوجة الإضافية، والتي تتعلم تضمين منفصل للمتكلم والمستمع بالنظر إلى قاعدة العاطفة للحوار.تشير الدراسات التجريبية الواسعة إلى أن نماذجنا تعتبر أكثر تعاطفا عن طريق التقييمات البشرية، بالمقارنة مع العديد من الأساليب الرئيسية القوية للاستجابة التعاطفية.
يعد توليد الاستجابة الشخصية ضروريا لمزيد من المحادثات التي يشبها الإنسان. ومع ذلك، وكيفية نموذج معلومات تخصيص المستخدم مع عدم وجود أوصاف شخص مستخدم صريح أو التركيبة السكانية لا يزال قيد التحقيق فيها. لمعالجة مشكلة بيانات Sparsity للبيانات والعدد الها ئل من المستخدمين، نستخدم عامل تخصيص Tensor لنموذج معلومات تخصيص المستخدمين مع تاريخ النشر. على وجه التحديد، نقدم تضمين الاستجابة الشخصية لجميع أزواج المستخدمين على المستخدمين وتشكيلها في موتر ثلاثي الحجم، متحللة من تحلل tucker. يتم تغذية تضمين الاستجابة الشخصية إما لمعرفة وحدة فك ترميز نموذج SEQ2SEQ القائمة على LSTM أو نموذج لغة محول للمساعدة في توليد المزيد من الردود الشخصية. لتقييم مدى تخصيص الاستجابات التي تم إنشاؤها، فإننا نقترح مزيدا من المرتبة المائية المستندة إلى الترتيب الواحد لكل من الزيارات @ k والتي تقيس أكثر من المرجح أن تأتي الردود التي تم إنشاؤها من المستخدمين المقابلين. تظهر النتائج على مجموعة بيانات المحادثة على نطاق واسع أن النماذج التي تعتمد على عامل توزيع العمال المقترح لدينا تولد استجابات أكثر تخصيصا وأكثر جودة مقارنة مع خطوط الأساس.
الجيل السردي هو مهمة NLP مفتوحة العضوية التي يولد فيها نموذج قصة إعطاء موجه.المهمة تشبه توليد الاستجابة العصبية لل Chatbots؛ومع ذلك، غالبا ما لا يتم تطبيق الابتكارات في توليد الاستجابة على جيل سرد، على الرغم من التشابه بين هذه المهام.نحن نهدف إلى سد هذه الفجوة من خلال تطبيق وتقييم التقدم في طرق فك تشفير جيل الاستجابة العصبية إلى توليد السرد العصبي.على وجه الخصوص، نحن نوظف GPT-2 وأداء الأزمة عبر عتبات أخذ العينات النواة ومثبتة تنوعا فرطيا مثبطا --- على وجه التحديد، والحد الأقصى للمعلومات المتبادلة - - تحليل النتائج على معايير متعددة مع التقييم التلقائي والإنساني.نجد أن (1) أخذ عينات نواة أفضل عموما مع عتبات بين 0.7 و 0.9؛(2) الحد الأقصى لهدف المعلومات المتبادلة يمكن أن يحسن نوعية القصص التي تم إنشاؤها؛و (3) لا ترتبط مقاييس التلقائية المنشأة بشكل جيد مع الأحكام الإنسانية لجودة السرد على أي متري نوعي.
يتطلب التواصل السلس والفعال القدرة على أداء استنتاج المناشد الكامن أو الصريح. يركز معايير التفكير في المناولة (مثل Socialiqa و Commonsenseqa) بشكل رئيسي على المهمة التمييزية المتمثلة في اختيار الإجابة الصحيحة من مجموعة من المرشحين، ولا تنطوي على تولي د لغة تفاعلية كما هو الحال في الحوار. علاوة على ذلك، فإن مجموعات بيانات الحوار الحالية لا تركز صراحة على عرض المنطقي كجايت. في هذه الورقة، نقدم دراسة تجريبية للعموم في توليد استجابة الحوار. نحن أولا استخراج السيارات الحوارات العمومية من مجموعات بيانات الحوار الموجودة من خلال الاستفادة من Congalnet، الرسم البياني المعرفة للعموم. علاوة على ذلك، بناء على السياقات الاجتماعية / المواقف في Socialiqa، نجمع مجموعة بيانات حوار جديدة مع حوارات 25 كيلو بايت تهدف إلى عرض العمولة الاجتماعية في بيئة تفاعلية. نقوم بتقييم نماذج توليد الاستجابة المدربة باستخدام مجموعات البيانات هذه والعثور على النماذج المدربة على كلا من المستخرجة وبياناتنا التي تم جمعها تنتج الردود التي تظهر باستمرار المزيد من المنطقي من الأساس. أخيرا، نقترح نهج للتقييم التلقائي للعموم التي تعتمد على ميزات مشتقة من نماذج النقدية واللغة المدربة مسبقا وحوار الحوار، وتظهر ارتباطا معقولا بالتقييم البشري لجودة الردود.
في توليد استجابة الحوار مفتوح المجال، يمكن أن يستمر سياق الحوار مع ردود متنوعة، وينبغي أن تتخذ طرازات الحوار علاقات واحدة إلى كثيرة.في هذا العمل، نقوم أولا بتحليل الهدف التدريبي لنماذج الحوار من وجهة نظر اختلاف Kullback-Leibler (KLD) وإظهار أن الفجوة بين توزيع الاحتمالات العالمي الحقيقي وتوزيع احتمالية البيانات المرجعية الفردية يمنع النموذج من تعلم الواحدإلى العديد من العلاقات بكفاءة.ثم نستكشف النهج للتدريب متعدد الإشارة في جوانبين.البيانات الحكيمة، ونحن نولد إشارات زائفة متنوعة من نموذج قوي مسبقا لبناء بيانات متعددة المرجعين توفر تقريب أفضل لتوزيع العالم الحقيقي.نموذج الحكمة، نقترح تجهيز نماذج مختلفة مع تعبيري قبل التعبير، اسمه Linear Gaussian النموذج (LGM).تظهر النتائج التجريبية للتقييم الآلي والتقييم البشري أن الطرق تسفر عن تحسينات كبيرة على أساس الأساس.
بالنسبة لجهاز كمبيوتر يتفاعل بشكل طبيعي مع إنسان، يجب أن يكون يشبه الإنسان.في هذه الورقة، نقترح نموذج توليد الاستجابة العصبي مع التعلم متعدد المهام للجيل والتصنيف، مع التركيز على العاطفة.يتم تدريب نموذجنا على أساس بارت (لويس وآخرون.، 2020)، وهو نموذج ترميز ترميز محول مدرب مسبقا، لتوليد الردود والاعتراف بالمشاعر في وقت واحد.علاوة على ذلك، فنحن نثق خسائر المهام للتحكم في تحديث المعلمات.تظهر التقييمات التلقائية والتقييمات الدليلية للجماعة الجماعية أن النموذج المقترح يجعل الردود التي تم إنشاؤها أكثر وعيا بنفسك.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا