ترغب بنشر مسار تعليمي؟ اضغط هنا

دراسة تغيرات ترددات رنين الإشارة الصوتية باختلاف معمارية الجهاز الصوتي للمتحدث

Analysis Study of Formant Frequencies Changes According to the Speaker's Vocal Tract Shape

1027   0   29   0 ( 0 )
 تاريخ النشر 2017
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تمَّ في هذا البحث دراسة تغيرات بعض خصائص الإشارة الصوتية تبعاً لعامل البنية التشريحية للجهاز الصوتي للمتحدث، إذ تمَّ بناء قاعدة بيانات تضم ملفات صوتية تعود إلى 57 متحدث بالغ تتراوح أعمارهم بين 35 و 45 عام جميعهم ذكور، جميع المتحدثين من خلفيات اجتماعية و ثقافية متقاربة، و لا يعانون من أي عيوب نطقية أو سمعية. سُجلت الملفات الصوتية المُضمنة في قاعدة البيانات ضمن شروط تسجيل مثالية، حيث تمً التسجيل في بيئة معزولة صوتياً و بحضور تقني صوت و خبير صوتيات، و استغرق التسجيل لكل متحدث حوالي خمس دقائق لفظ فيها الحروف الصوتية العربية (الألف و الواو و الياء) من خلال لفظه لكلمة "سألتمُونِيهَا" ثلاث مرات متتالية. اعتماداً على تحليل التسجيلات الصوتية الناتجة تمَّ رصد التغيرات الحاصلة في قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و المسماة النغمات (Formants)، حيث أن الأبعاد و الشكل الفسيولوجي للجهاز الصوتي المتعلق بالاصطناع العام للجسم يعتبر من أهم المعلومات التي يمكن التنبؤ بها من تحليل الإشارة الصوتية. لقد أظهرت نتائج هذا البحث وجود تناسباً عكسياً بين قيم ترددات النغمات الثلاثة الأولى F1, F2, F3 و بين طول المجرى الصوتي، بينما لا توجد علاقة واضحة بين ترددات النغمتين الرابعة و الخامسة F4, F5 و بين طول المجرى الصوتي (Vocal Tract.


ملخص البحث
تتناول هذه الدراسة البحثية التغيرات في ترددات الرنين الصوتي (Formant Frequencies) بناءً على معمارية الجهاز الصوتي للمتحدث. تم بناء قاعدة بيانات صوتية تضم ملفات صوتية لـ 57 متحدثًا من الذكور تتراوح أعمارهم بين 35 و 45 عامًا، جميعهم من خلفيات اجتماعية وثقافية متشابهة ولا يعانون من أي مشاكل نطقية أو سمعية. تم تسجيل الملفات الصوتية في بيئة معزولة صوتياً باستخدام كلمة 'سألتمُونيها' التي تحتوي على الحروف الصوتية الطويلة في اللغة العربية. أظهرت النتائج وجود علاقة عكسية بين ترددات النغمات الثلاثة الأولى (F1, F2, F3) وطول المجرى الصوتي، بينما لم تظهر علاقة واضحة بين ترددات النغمتين الرابعة والخامسة (F4, F5) وطول المجرى الصوتي. تم استخدام خوارزمية (MFCC) لاستخلاص السمات الصوتية من التسجيلات. توصي الدراسة بمزيد من البحث في تأثير البنية الفسيولوجية لباقي أجزاء جهاز النطق على ترددات الرنين الصوتي.
قراءة نقدية
دراسة نقدية: تعتبر هذه الدراسة خطوة مهمة في فهم العلاقة بين معمارية الجهاز الصوتي وترددات الرنين الصوتي، إلا أنها تقتصر على عينة محددة من المتحدثين الذكور في فئة عمرية معينة ومن خلفيات اجتماعية وثقافية متشابهة. قد يكون من المفيد توسيع نطاق الدراسة لتشمل متحدثين من مختلف الأعمار والجنس والخلفيات الثقافية للحصول على نتائج أكثر شمولية. كما أن الدراسة لم تتناول تأثير العوامل الأخرى مثل الحالة النفسية أو الصحية للمتحدثين على ترددات الرنين الصوتي، وهو ما يمكن أن يكون له تأثير كبير. بالإضافة إلى ذلك، يمكن تحسين دقة النتائج باستخدام تقنيات تسجيل وتحليل أكثر تطوراً.
أسئلة حول البحث
  1. ما هي العلاقة بين ترددات النغمات الثلاثة الأولى وطول المجرى الصوتي؟

    أظهرت الدراسة وجود علاقة عكسية بين ترددات النغمات الثلاثة الأولى (F1, F2, F3) وطول المجرى الصوتي، حيث تنخفض ترددات هذه النغمات بزيادة طول المجرى الصوتي.

  2. ما هي الكلمة التي استخدمت في تسجيل الملفات الصوتية للدراسة؟

    تم استخدام كلمة 'سألتمُونيها' في تسجيل الملفات الصوتية للدراسة، وهي كلمة تحتوي على الحروف الصوتية الطويلة في اللغة العربية.

  3. ما هي الخوارزمية المستخدمة لاستخلاص السمات الصوتية من التسجيلات؟

    تم استخدام خوارزمية (MFCC) لاستخلاص السمات الصوتية من التسجيلات.

  4. هل أظهرت الدراسة علاقة واضحة بين ترددات النغمتين الرابعة والخامسة وطول المجرى الصوتي؟

    لا، لم تظهر الدراسة علاقة واضحة بين ترددات النغمتين الرابعة والخامسة (F4, F5) وطول المجرى الصوتي.


المراجع المستخدمة
M. E. Ayadi , M. S. Kamel , F. Karray, “Survey on Speech Emotion Recognition: Features, Classification Schemes, And Databases”, Pattern Recognition 44, PP.572-587, 2011
I. Chiriacescu , “Automatic Emotion Analysis Based On Speech” , M.Sc. THESIS Delft University of Technology, 2009
Nitin Thapliyal , Gargi Amoli “Speech based Emotion Recognition with Gaussian Mixture Model” international Journal of Advanced Research in Computer Engineering & Technology Volume 1, Issue 5, July 2012
قيم البحث

اقرأ أيضاً

يعرض و يوصفُ في هذا البحث نموذج كبسترالي للجهاز الصوتي، يقوم النموذج موضوع البحث بنمذجة كل من "المتناغمات الصوتية" و"أضداد المتناغمات الصوتية" . بهذه الطريقة نحصل على نموذج أدق من نموذج التنبؤ الخطي الذي يقوم فقط بنمذجة "المتناغمات الصوتية" للجهاز الصوتي. من أجل التحويل العكسي اِستُخدِم التابع الأسي، و لما كان من الصعب تنفيذ هذا التابع بواسطة معدل إشارة رقمي. فقد اِستُخدِمت طريقة النشر إلى كسور متتابعة من أجل تقريب التابع الاسي و جعل تنفيذه ممكناً على المعالج الرقمي. نُفِّذ تابع النقل الذي استخدم لتمثيل التابع الأسي باستخدام مرشح رقمي من النوع IIR بحيث يتضمن هذا المرشح في فروعه مرشحات رقمية من النوع FIR. معاملات مرشحات FIR كانت ببساطة معاملات حقيقية لكبستروم الكلام. و اِفْتُرِضت معادلات فرقية في فراغ الحالة و تطبيقها على معالج إشارة رقمي من شركة موتورولا ذي فاصلة ثابتة. في النهاية قُيمت نتائج تنفيذ النموذج على معالج إشارة رقمي؛ و ذلك لحروف مختارة، صوتية و لاصوتية.
درسنا تغيرات Mv و Mw بدلالة ترسيم كول كول تحت تأثير درجات الحرارة و الترددات الديناميكية المختلفة لعدد من البوليمرات: البولي بروبيلن PP إيزوتاكتيك و البولي بوتن PB و البولي أميد PA- ١٢ ١٢ و البولي إتيلن مرتفع الكثافة HDPE و البولي فينيل كلوريد PVC.
جمعت 90 عينة بول من مرضى يعانون من التهاب المجاري البولية لغرض التحري عن الإشريكية القولونية. بعد الزرع و التشخيص الكيميائي الحيوي, تم الحصول على 47 عينة إيجابية من أصل 74 أي بنسبة 63.5% ظهر فيها النمو الجرثومي.
إن رص الخلطات الإسفلتية الساخنة (HMA) عند درجات حراة منخفضة أو خلطها في المجابل عند درجات حرارة عالية يشكل مصدر قلق دائم للباحثين , حيث يؤدي الرص والخلط عند درجات حرارة غير مثالية إلى الحصول على نتائج عكسية والتي تؤثر سلباً على خصائص الخرسانة الإسفلتية وتؤدي لحدوث مشاكل بالرصف .
سمحت القياسات الجيوفيزيائية البئرية، و إعادة تفسير نتائجها باستخدام التقنيات و البرامج الحاسوبية العلمية الحديثة، فضلاً عن تحليل معطيات العينات الصخرية، و نتائج المسح السيزمي ثنائي و ثلاثي البعد، بتعرف الخصائص الخزنية لتشكيلة الكوراشينا دولوميت (KD) العائدة للترياسي الأوسط بنطاقيها (C2, D1) في حقل جحار، و تأثيرها في المأمولية الهيدروكربونية في هذه المنطقة. و قد تبين أن نطاق C2 تسيطر عليه سحنات دولوميتية قليلة الغضار و الانهدريت، مشققة و الشقوق مملوءة بمواد عضوية، و كالسيت، و أنهدريت، و سيليكات، تقطعه بنيات عميدية (ستيللوليت) بشكل جزئي، في حين تسود تناوبات من الحجر الكلسي مع بقايا مستحاثية، و في بعض المجالات دولوميت غضاري ستيللوليتي. أما نطاق D1 فيغلب عليه الحجر الكلسي المتبلور، و ضمن التجاويف يوجد الدولوميت.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا