ترغب بنشر مسار تعليمي؟ اضغط هنا

عملة: الشبكات التفاعلية للمحادثة للتعرف على العاطفة في المحادثة

COIN: Conversational Interactive Networks for Emotion Recognition in Conversation

267   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تلقى الاعتراف بالمحادثة في المحادثة اهتماما كبيرا مؤخرا بسبب تطبيقاتها الصناعية العملية.تميل الأساليب الحالية إلى التغاضي عن التفاعل المتبادل الفوري بين مكبرات الصوت المختلفة في مستوى الكلام المتكلم، أو قم بتطبيق RNN المتكلم المرغوب عن الكلام من مختلف المتحدثين.نقترح عملة معدنية، نموذج تفاعلي محادثة لتخفيف هذه المشكلة عن طريق تطبيق التفاعل المتبادل الحكومي في سياقات التاريخ.بالإضافة إلى ذلك، نقدم وحدة تفاعلية عالمية مكدسة لالتقاط تمثيل السياق والاعتماد بين الاعتمادات بطريقة هرمية.لتحسين المتانة والتعميم أثناء التدريب، نقوم بإنشاء أمثلة خصومة من خلال تطبيق الاضطرابات البسيطة بشأن مدخلات ميزة متعددة الوسائط، كشف النقاب عن فوائد الأمثلة العداء للكشف عن المشاعر.ينص النموذج المقترح بشكل تجريبي النتائج الحالية على النتائج الحالية على مجموعة بيانات IEMOCAP Benchmark.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم إجراء عدة دراسات حديثة حول التفاعلات البشرية الدينية على المحادثات دون أهداف تجارية محددة. ومع ذلك، قد تستفيد العديد من الشركات من الدراسات المخصصة لبيئات أكثر دقة مثل خدمات ما بعد البيع أو استطلاعات رضا العملاء. في هذا العمل، نضع أنفسنا في نطاق خ دمة عملاء الدردشة الحية التي نريد اكتشاف العواطف وتطورها في تدفق المحادثة. يؤدي هذا السياق إلى تحديات متعددة تتراوح من استغلال مجموعات البيانات المحظورة والصغيرة والغلبية غير المستمرة لإيجاد وتكيف مع طرق هذا السياق. نحن نتعامل مع هذه التحديات باستخدام عدد قليل من التعلم أثناء صنع الفرضية التي يمكن أن تخدم تصنيف المشاعر المحادثة لغات مختلفة وتسميات متفرق. نحن نساهم باقتراح تباين من الشبكات النموذجية للحصول على تسلسل وضع العلامات في المحادثة التي نسمينا protoseq. نحن نختبر هذه الطريقة على رقمين مع لغات مختلفة: المحادثات اليومية في محادثات الدردشة الإنجليزية وخدمة العملاء في الفرنسية. عند تطبيقها على تصنيف العاطفة في المحادثات، أثبتت طريقنا أنها تنافسية حتى مقارنة بأخرى أخرى.
أصبح التعرف على العاطفة في محادثة متعددة الأحزاب (ermc) شعبية بشكل متزايد كقاعدة بحثية ناشئة في معالجة اللغة الطبيعية.يركز البحث المسبق على استكشاف معلومات متتابعة ولكن يتجاهل هياكل المحادثات.في هذه الورقة، يمكننا التحقيق في أهمية هياكل الخطاب في الت عامل مع الإشارات السياقية الإعلامية والمعلومات الخاصة بالمتكلات الخاصة ب armc.تحقيقا لهذه الغاية، نقترح علما رسميا في رسم بياني (ERMC-DISGCN) ل ERMC.على وجه الخصوص، نقوم بتصميم الأزلاء العلائقية إلى رافعة تبعية المتكلم الذاتي للواقعاء نشر معلومات سياقية.علاوة على ذلك، فإننا نستنفذ عن مراقبة بوابات لاختيار إشارات أكثر إفادة ل armc من التحويلات المعالين.تظهر النتائج التجريبية طريقة أن أسلوبنا تتفوق على خطوط أساس متعددة، مما يوضح أن هياكل الخطاب ذات قيمة كبيرة ل armc.
يعمل المصنف الموجود في مهام الحوسبة العاطفية متعددة الوسائط، مثل التعرف على العاطفة والتعرف على الشخصية، عموما خط أنابيب ذات مرحلتين من خلال أول استخراج تمثيلات ميزة لكل طريقة واحدة مع الخوارزميات المصنوعة يدويا، ثم أداء التعلم المنتهي مع الميزات الم ستخرجة. ومع ذلك، يتم إصلاح الميزات المستخرجة ولا يمكن ضبطها بشكل جيد على المهام المستهدفة المختلفة، والعثور على ميزة خوارزميات الاستخراج يدويا لا تعميم أو مقياس جيدا لمهام مختلفة، والتي يمكن أن تؤدي إلى الأداء دون الأمثل. في هذه الورقة، نقوم بتطوير نموذج طرف بالكامل يربط المرحلتين وتحسينها بشكل مشترك. بالإضافة إلى ذلك، نقوم بإعادة هيكلة مجموعات البيانات الحالية لتمكين التدريب الكامل للنهاية. علاوة على ذلك، لتقليل النفقات الحاسوبية النماذج المحسوبة بالنماذج الطرفية إلى النهاية، نقدم آلية اهتمامية متناثرة عبر مشروط لاستخراج الميزة. تظهر النتائج التجريبية أن طرازنا الناتج الكامل ينفج بشكل كبير يتفوق بشكل كبير النماذج الحالية للحالة القائمة على خط أنابيب الطورين. علاوة على ذلك، من خلال إضافة اهتمام متناثر عبر الوسائط، يمكن لنموذجنا الحفاظ على الأداء مع حوالي نصف حساب أقل في جزء استخراج الميزة من النموذج.
تعتبر التعرف على عاطلة المحادثة (CER) مهمة للتنبؤ بمشاعر الكلام في سياق محادثة. على الرغم من أن نمذجة سياق المحادثة والتفاعلات بين المتحدثين قد درست على نطاق واسع، إلا أنه من المهم النظر في الدولة النفسية للمتحدث، والتي تسيطر على عمل ومكبر الصوت. تقد م الطريقة التي من بين الفنون المعرفة المنطقية (CSK) نموذجا نفسيا بطريقة متتالية (إلى الأمام والخلف). ومع ذلك، فإنه يتجاهل التفاعلات النفسية الهيكلية بين الكلام. في هذه الورقة، نقترح رسم بياني تفاعل علمي المعرفة (Skaig). في الرسم البياني المرتبط محليا، سيتم تعزيز النطق المستهدف مع معلومات العمل التي استنتجها من السياق الماضي ونهايها الضمنية السياق المستقبلية. الكلام مرتبط بالنظر في الاعتبار التأثير الحالي من نفسه. علاوة على ذلك، نستخدم CSK لإثراء الحواف بتمثيل المعرفة وعمل Skaig مع محول الرسم البياني. تقوم طريقةنا بتحقيق الأداء الحكومي والتنافسي في أربعة مجموعات بيانات CRES.
بسبب شعبية خدمات مساعد الحوار الذكي، أصبح التعرف على عاطفي الكلام أكثر وأكثر أهمية.في التواصل بين البشر والآلات، يمكن للتعرف على العاطفة وتحليل العاطفة تعزيز التفاعل بين الآلات والبشر.تستخدم هذه الدراسة نموذج CNN + LSTM لتنفيذ معالجة العاطفة الكلام ( SER) والتنبؤ بها.من النتائج التجريبية، من المعروف أن استخدام نموذج CNN + LSTM يحقق أداء أفضل من استخدام نموذج NN التقليدي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا