ترغب بنشر مسار تعليمي؟ اضغط هنا

نموذج متفرق متعدد الإنهاء للتعرف على العاطفة

Multimodal End-to-End Sparse Model for Emotion Recognition

414   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعمل المصنف الموجود في مهام الحوسبة العاطفية متعددة الوسائط، مثل التعرف على العاطفة والتعرف على الشخصية، عموما خط أنابيب ذات مرحلتين من خلال أول استخراج تمثيلات ميزة لكل طريقة واحدة مع الخوارزميات المصنوعة يدويا، ثم أداء التعلم المنتهي مع الميزات المستخرجة. ومع ذلك، يتم إصلاح الميزات المستخرجة ولا يمكن ضبطها بشكل جيد على المهام المستهدفة المختلفة، والعثور على ميزة خوارزميات الاستخراج يدويا لا تعميم أو مقياس جيدا لمهام مختلفة، والتي يمكن أن تؤدي إلى الأداء دون الأمثل. في هذه الورقة، نقوم بتطوير نموذج طرف بالكامل يربط المرحلتين وتحسينها بشكل مشترك. بالإضافة إلى ذلك، نقوم بإعادة هيكلة مجموعات البيانات الحالية لتمكين التدريب الكامل للنهاية. علاوة على ذلك، لتقليل النفقات الحاسوبية النماذج المحسوبة بالنماذج الطرفية إلى النهاية، نقدم آلية اهتمامية متناثرة عبر مشروط لاستخراج الميزة. تظهر النتائج التجريبية أن طرازنا الناتج الكامل ينفج بشكل كبير يتفوق بشكل كبير النماذج الحالية للحالة القائمة على خط أنابيب الطورين. علاوة على ذلك، من خلال إضافة اهتمام متناثر عبر الوسائط، يمكن لنموذجنا الحفاظ على الأداء مع حوالي نصف حساب أقل في جزء استخراج الميزة من النموذج.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

بسبب شعبية خدمات مساعد الحوار الذكي، أصبح التعرف على عاطفي الكلام أكثر وأكثر أهمية.في التواصل بين البشر والآلات، يمكن للتعرف على العاطفة وتحليل العاطفة تعزيز التفاعل بين الآلات والبشر.تستخدم هذه الدراسة نموذج CNN + LSTM لتنفيذ معالجة العاطفة الكلام ( SER) والتنبؤ بها.من النتائج التجريبية، من المعروف أن استخدام نموذج CNN + LSTM يحقق أداء أفضل من استخدام نموذج NN التقليدي.
تلقى الاعتراف بالمحادثة في المحادثة اهتماما كبيرا مؤخرا بسبب تطبيقاتها الصناعية العملية.تميل الأساليب الحالية إلى التغاضي عن التفاعل المتبادل الفوري بين مكبرات الصوت المختلفة في مستوى الكلام المتكلم، أو قم بتطبيق RNN المتكلم المرغوب عن الكلام من مختل ف المتحدثين.نقترح عملة معدنية، نموذج تفاعلي محادثة لتخفيف هذه المشكلة عن طريق تطبيق التفاعل المتبادل الحكومي في سياقات التاريخ.بالإضافة إلى ذلك، نقدم وحدة تفاعلية عالمية مكدسة لالتقاط تمثيل السياق والاعتماد بين الاعتمادات بطريقة هرمية.لتحسين المتانة والتعميم أثناء التدريب، نقوم بإنشاء أمثلة خصومة من خلال تطبيق الاضطرابات البسيطة بشأن مدخلات ميزة متعددة الوسائط، كشف النقاب عن فوائد الأمثلة العداء للكشف عن المشاعر.ينص النموذج المقترح بشكل تجريبي النتائج الحالية على النتائج الحالية على مجموعة بيانات IEMOCAP Benchmark.
أصبح التعرف على العاطفة في محادثة متعددة الأحزاب (ermc) شعبية بشكل متزايد كقاعدة بحثية ناشئة في معالجة اللغة الطبيعية.يركز البحث المسبق على استكشاف معلومات متتابعة ولكن يتجاهل هياكل المحادثات.في هذه الورقة، يمكننا التحقيق في أهمية هياكل الخطاب في الت عامل مع الإشارات السياقية الإعلامية والمعلومات الخاصة بالمتكلات الخاصة ب armc.تحقيقا لهذه الغاية، نقترح علما رسميا في رسم بياني (ERMC-DISGCN) ل ERMC.على وجه الخصوص، نقوم بتصميم الأزلاء العلائقية إلى رافعة تبعية المتكلم الذاتي للواقعاء نشر معلومات سياقية.علاوة على ذلك، فإننا نستنفذ عن مراقبة بوابات لاختيار إشارات أكثر إفادة ل armc من التحويلات المعالين.تظهر النتائج التجريبية طريقة أن أسلوبنا تتفوق على خطوط أساس متعددة، مما يوضح أن هياكل الخطاب ذات قيمة كبيرة ل armc.
يعد تحليل الإطار الدلالي مهمة تحليل دلالية تعتمد على Framenet التي تلقت اهتماما كبيرا مؤخرا.تتضمن المهمة عادة ثلاث مجموعات فرعية بالتتابع: (1) التعرف المستهدف، (2) تصنيف الإطار و (3) وصف الدور الدليمي.ترتبط المهارات الفرعية الثلاثة ارتباطا وثيقا أثنا ء وجود دراسات سابقة طرازها بشكل فردي، مما يتجاهل اتصالاتهم المتدربين، وفي الوقت نفسه يحث مشكلة نشر الأخطاء.في هذا العمل، نقترح نموذج عصبي نهاية إلى نهائي لمعالجة المهمة بشكل مشترك.بشكل ملموس، استغلنا طريقة قائمة على الرسم البياني، فيما يتعلق بتحليل الإطار الدلالي كمشكلة بناء الرسم البياني.يتم التعامل مع جميع المسندات والأدوار كجزء رسم بياني، ويتم أخذ علاقاتهم كحواف رسم بياني.نتائج التجربة على مجموعة بيانات قياسية من الإطار الدلالي تظهر أن طريقتنا تنافسية للغاية، مما يؤدي إلى أداء أفضل من نماذج خطوط الأنابيب.
يمكن للقدرة على اكتشاف الإجهاد البشري تلقائيا أن تفيد العوامل الذكية الاصطناعية المشاركة في الحوسبة العاطفية والتفاعل البشري والحاسوب.الإجهاد والعاطفة كلا من الدول العاطفية البشرية، وقد أثبت الإجهاد أن يكون لها آثار مهمة على تنظيم العاطفة والتعبير عن ها.على الرغم من أن سلسلة من الأساليب قد تم تأسيسها للكشف عن الإجهاد المتعدد الوسائط، فقد تم اتخاذ خطوات محدودة لاستكشاف الاعتماد الوارد في الاتجاهات الأساسية بين الإجهاد والعاطفة.في هذا العمل، نحقق في قيمة التعرف على العاطفة كملقمة مساعدة لتحسين اكتشاف الإجهاد.نقترح Muser - وهي عبارة عن بنية نموذجية قائمة على المحولات وخوارزمية تعليمية متعددة المهام الجديدة مع استراتيجية أخذ العينات الديناميكية المستندة إلى السرعة.يوضح التقييم في مجموعة بيانات المشاعر المشددة متعددة الوسائط (MUSE) أن طرازنا فعال للكشف عن الإجهاد بالمهام المساعدة الداخلية والخارجية، وتحقق نتائج أحدث النتائج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا