ترغب بنشر مسار تعليمي؟ اضغط هنا

التعرف على العاطفة الكلام بناء على نموذج CNN + LSTM

Speech Emotion Recognition Based on CNN+LSTM Model

735   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

بسبب شعبية خدمات مساعد الحوار الذكي، أصبح التعرف على عاطفي الكلام أكثر وأكثر أهمية.في التواصل بين البشر والآلات، يمكن للتعرف على العاطفة وتحليل العاطفة تعزيز التفاعل بين الآلات والبشر.تستخدم هذه الدراسة نموذج CNN + LSTM لتنفيذ معالجة العاطفة الكلام (SER) والتنبؤ بها.من النتائج التجريبية، من المعروف أن استخدام نموذج CNN + LSTM يحقق أداء أفضل من استخدام نموذج NN التقليدي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يعمل المصنف الموجود في مهام الحوسبة العاطفية متعددة الوسائط، مثل التعرف على العاطفة والتعرف على الشخصية، عموما خط أنابيب ذات مرحلتين من خلال أول استخراج تمثيلات ميزة لكل طريقة واحدة مع الخوارزميات المصنوعة يدويا، ثم أداء التعلم المنتهي مع الميزات الم ستخرجة. ومع ذلك، يتم إصلاح الميزات المستخرجة ولا يمكن ضبطها بشكل جيد على المهام المستهدفة المختلفة، والعثور على ميزة خوارزميات الاستخراج يدويا لا تعميم أو مقياس جيدا لمهام مختلفة، والتي يمكن أن تؤدي إلى الأداء دون الأمثل. في هذه الورقة، نقوم بتطوير نموذج طرف بالكامل يربط المرحلتين وتحسينها بشكل مشترك. بالإضافة إلى ذلك، نقوم بإعادة هيكلة مجموعات البيانات الحالية لتمكين التدريب الكامل للنهاية. علاوة على ذلك، لتقليل النفقات الحاسوبية النماذج المحسوبة بالنماذج الطرفية إلى النهاية، نقدم آلية اهتمامية متناثرة عبر مشروط لاستخراج الميزة. تظهر النتائج التجريبية أن طرازنا الناتج الكامل ينفج بشكل كبير يتفوق بشكل كبير النماذج الحالية للحالة القائمة على خط أنابيب الطورين. علاوة على ذلك، من خلال إضافة اهتمام متناثر عبر الوسائط، يمكن لنموذجنا الحفاظ على الأداء مع حوالي نصف حساب أقل في جزء استخراج الميزة من النموذج.
تلقت الأساليب القائمة على القاموس في تحليل المعنويات الاهتمام العلمي مؤخرا، وأكثر الأمثلة الشاملة التي يمكن العثور عليها باللغة الإنجليزية. ومع ذلك، فإن العديد من اللغات الأخرى تفتقر إلى قواميس القطبية، أو تلك الموجودة صغيرة الحجم كما في حالة SentiTu rknet، أول وفقط القطبية القاسم في التركية. وبالتالي، تهدف هذه الدراسة إلى تمديد محتوى SentiTurknet من خلال مقارنة الكلامين المتاحين في التركية، وهي Kenet و TR-Wordnet من Balkanet. تحقيقا لهذه الغاية، تم إنشاء قاموس الأسقفية التركية الحالية بالاعتماد على 76825 متلازمة مطابقة Kenet، حيث تم تفاح كل Synset مع ثلاث ملصقات قطبية، وهي إيجابية وسلبية ومحايدة. وفي الوقت نفسه، كشفت مقارنة Kenet و Tr-Wordnet of Balkanet عن نقاط الضعف الخاصة بهم مثل تكرار نفس الحواس، ونقص الدمج اللازم للعناصر التي تنتمي إلى نفس المكامنة ووجود إصدارات أضيق زائدة من التزامن، والتي تتم مناقشتها في ضوء إمكاناتهم لتحسين قواعد البيانات المعجمية الحالية التركية.
يمكن للقدرة على اكتشاف الإجهاد البشري تلقائيا أن تفيد العوامل الذكية الاصطناعية المشاركة في الحوسبة العاطفية والتفاعل البشري والحاسوب.الإجهاد والعاطفة كلا من الدول العاطفية البشرية، وقد أثبت الإجهاد أن يكون لها آثار مهمة على تنظيم العاطفة والتعبير عن ها.على الرغم من أن سلسلة من الأساليب قد تم تأسيسها للكشف عن الإجهاد المتعدد الوسائط، فقد تم اتخاذ خطوات محدودة لاستكشاف الاعتماد الوارد في الاتجاهات الأساسية بين الإجهاد والعاطفة.في هذا العمل، نحقق في قيمة التعرف على العاطفة كملقمة مساعدة لتحسين اكتشاف الإجهاد.نقترح Muser - وهي عبارة عن بنية نموذجية قائمة على المحولات وخوارزمية تعليمية متعددة المهام الجديدة مع استراتيجية أخذ العينات الديناميكية المستندة إلى السرعة.يوضح التقييم في مجموعة بيانات المشاعر المشددة متعددة الوسائط (MUSE) أن طرازنا فعال للكشف عن الإجهاد بالمهام المساعدة الداخلية والخارجية، وتحقق نتائج أحدث النتائج.
تم إجراء عدة دراسات حديثة حول التفاعلات البشرية الدينية على المحادثات دون أهداف تجارية محددة. ومع ذلك، قد تستفيد العديد من الشركات من الدراسات المخصصة لبيئات أكثر دقة مثل خدمات ما بعد البيع أو استطلاعات رضا العملاء. في هذا العمل، نضع أنفسنا في نطاق خ دمة عملاء الدردشة الحية التي نريد اكتشاف العواطف وتطورها في تدفق المحادثة. يؤدي هذا السياق إلى تحديات متعددة تتراوح من استغلال مجموعات البيانات المحظورة والصغيرة والغلبية غير المستمرة لإيجاد وتكيف مع طرق هذا السياق. نحن نتعامل مع هذه التحديات باستخدام عدد قليل من التعلم أثناء صنع الفرضية التي يمكن أن تخدم تصنيف المشاعر المحادثة لغات مختلفة وتسميات متفرق. نحن نساهم باقتراح تباين من الشبكات النموذجية للحصول على تسلسل وضع العلامات في المحادثة التي نسمينا protoseq. نحن نختبر هذه الطريقة على رقمين مع لغات مختلفة: المحادثات اليومية في محادثات الدردشة الإنجليزية وخدمة العملاء في الفرنسية. عند تطبيقها على تصنيف العاطفة في المحادثات، أثبتت طريقنا أنها تنافسية حتى مقارنة بأخرى أخرى.
أصبحت نماذج المحولات التي يتم ضبطها بشكل جيد مع هدف وضع العلامات على التسلسل الاختيار المهيمن لمهام التعرف على الكيان المسمى. ومع ذلك، يمكن أن تفشل آلية اهتمام الذات مع طول غير مقيد في التقاط التبعيات المحلية بالكامل، خاصة عندما تكون البيانات التدريب ية محدودة. في هذه الورقة، نقترح هدف تدريب مشترك جديد يلتقط أفضل دلالات الكلمات المقابلة لنفس الكيان. من خلال زيادة هدف التدريب مع عنصر فقدان المجموعة-الاتساق، فإننا نعزز قدرتنا على التقاط التبعيات المحلية مع الاستمتاع بمزايا آلية اهتمام الذات غير المقيد. على DataSet Conll2003، تحقق طريقة لدينا اختبار F1 من 93.98 مع نموذج محول واحد. الأهم من ذلك أن نموذج Conlll2003 الخاص بنا يعرض مكاسب كبيرة في تعميم البيانات خارج نطاق البيانات: على مجموعة بيانات OnTonotes، نحقق F1 من 72.67 وهو 0.49 نقطة مطلقا أفضل من خط الأساس، وعلى WNUT16 تعيين F1 من 68.22 وهو مكاسب من 0.48 نقطة. علاوة على ذلك، في DataSet WNUT17، نحقق F1 من 55.85، مما يؤدي إلى تحسن مطلق 2.92 نقطة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا