تعلم السمات المعالجة من Audiobooks من خلال تحويل الصوت


الملخص بالعربية

إن المشكلات، والمكونات غير المعجمية في الكلام، تلعب دورا حاسما في التفاعل البشري البشري.من الصعب التدريب على النماذج المصممة للاعتراف بالمعلومات المشكلية، وخاصة مشاعر الكلام والأسلوب، بسبب مجموعات البيانات المحدودة المسمى المتاحة.في هذا العمل، نقدم إطارا جديدا يمكن شبكة عصبية لتعلم استخراج السمات المعالجة من الكلام باستخدام البيانات غير المشروح للعاطفة.نقوم بتقييم فائدة المدينات المستفادة على مهام المصب في الاعتراف بالمشاعر والكشف عن أسلوب التحدث، مما يدل على تحسينات كبيرة على الميزات الصوتية السطحية وكذلك على المدينات المستخرجة من مناهج أخرى غير مخالفة.يتيح عملنا أنظمة المستقبل الاستفادة من النازع التضمين المستفاد كمكون منفصل قادر على تسليط الضوء على المكونات المعيارية في الكلام.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث