التعديل الطيفي للاعتراف بخطاب الأطفال الظروف المستدامة


الملخص بالعربية

في هذه الورقة، نقترح التعديل الطيفي عن طريق شحذ الأشكال وغير من خلال تقليل الميل الطيفي إلى التعرف على خطاب الأطفال حسب أنظمة التعرف على الكلام التلقائي (ASR) المطورة باستخدام خطاب البالغين.في هذا النوع من الحالة غير المعطاة، يتدهور أداء ASR بسبب عدم التطابق الصوتي واللغوي في السمات بين الأطفال والكبار.يتم استخدام الطريقة المقترحة لتحسين الوضوخي للكلام لتعزيز التعرف على خطاب الأطفال باستخدام نموذج صوتي مدرب على خطاب البالغين.في التجارب، يتم استخدام WSJCAM0 و PFSTAR كقواعد بيانات للبالغين وخطاب الأطفال، على التوالي.تتيح التقنية المقترحة تحسنا كبيرا في سياق ASR القائم على DNN-HMM.علاوة على ذلك، نحن نقوم بالتحقق من صحة متانة التقنية من خلال إظهار أنها تنفذ أيضا في ظروف ضوضاء غير متطابقة.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث