ترغب بنشر مسار تعليمي؟ اضغط هنا

توليد و تحليل المضلعات الصوتية للهجات سورية اعتماداً على قاعدة بيانات صوتية مُنجَزة

Generation and Analysis of Vowel Polygons for Syrian Dialects Using a Created Speech Database

1326   0   16   0 ( 0 )
 تاريخ النشر 2015
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تشكل قواعد البيانات الصوتية حجر الأساس في بناء نظم النطق الآلي و التعرف الآلي على الكلام و على المتكلم باختلاف اللغات و اللهجات، و تكون عناصر قاعدة البيانات الصوتية عادةً ملفات صوتية سبق أن سجلت لأصوات أشخاص باللغة أو اللهجة المطلوبة، و كلما ذخرت قاعدة البيانات الصوتية بعناصر شاملة كلما أسهم ذلك في إنتاج أنظمة تخاطب مع الآلة ذات أداء متميز. و نظراً لعدم توفر قاعدة بيانات صوتية للهجات السورية؛ تمَّ في البحث بإنشاء قاعدة بيانات للصوتيات السورية، ضمت ستة عشر متطوع و متطوعة من مناطق سورية مختلفة اللهجة سُجلت أصواتهم في ظروف تسجيل مختلفة؛ و ذلك لدراسة تأثير تنوع اللهجات و اختلاف الجنس و ظروف التسجيل على مساحات المضلعات الصوتية. استثمر هذا البحث قاعدة البيانات الصوتية المُنجزة في مجال توليد و تحليل مضلعات الصوتيات السورية، و بالتالي تمَّ الحصول 64 مضلع صوتي تعود إلى 16 متحدث،حيث أن المضلع الصوتي هو مضلع هندسي رؤوسه تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات ((Formants، و مساحة المضلع الصوتي الناتج تمثل مساحة المجال الصوتي.


ملخص البحث
تتناول هذه الدراسة إنشاء قاعدة بيانات صوتية للهجات السورية وتحليل المضلعات الصوتية الناتجة عنها. تم تسجيل أصوات 16 متحدثًا من مختلف المناطق السورية بلهجات متنوعة وظروف تسجيل مختلفة. يهدف البحث إلى دراسة تأثير تنوع اللهجات والجنس وظروف التسجيل على مساحات المضلعات الصوتية. تم استخدام خوارزمية MFCC لاستخلاص ترددات النغمات الصوتية وتحليلها. النتائج أظهرت تباينًا في مساحات المضلعات الصوتية بين التسجيل الاحترافي والتسجيل العادي، وكذلك بين الذكور والإناث. توصي الدراسة بتوسيع قاعدة البيانات لتشمل فئات عمرية مختلفة ودراسة تأثير العمر على المجال الصوتي.
قراءة نقدية
دراسة نقدية: تُعتبر هذه الدراسة خطوة مهمة نحو فهم الخصائص الصوتية للهجات السورية، إلا أنها تفتقر إلى شمولية أكبر من حيث عدد المتحدثين وتنوع الأعمار. كما أن الاعتماد على تسجيلات في ظروف مختلفة قد يؤثر على دقة النتائج. يُفضل أن يتم استخدام تقنيات تسجيل موحدة لضمان تجانس البيانات. بالإضافة إلى ذلك، يمكن أن تكون الدراسة أكثر فائدة إذا تضمنت تحليلًا أعمق لتأثير العوامل الاجتماعية والثقافية على اللهجات.
أسئلة حول البحث
  1. ما الهدف الرئيسي من إنشاء قاعدة البيانات الصوتية للهجات السورية؟

    الهدف الرئيسي هو دراسة تأثير تنوع اللهجات والجنس وظروف التسجيل على مساحات المضلعات الصوتية وتطوير نظم حاسوبية للتعرف على الكلام والنطق الآلي للهجات السورية.

  2. ما هي خوارزمية MFCC المستخدمة في الدراسة؟

    خوارزمية MFCC (Mel Frequency Cepstral Coefficients) هي خوارزمية تُستخدم لاستخلاص السمات الصوتية من الإشارات الصوتية، وهي تُستخدم بشكل واسع في تحليل ومعالجة الصوتيات.

  3. ما هي النتائج الرئيسية التي توصلت إليها الدراسة؟

    النتائج أظهرت تباينًا في مساحات المضلعات الصوتية بين التسجيل الاحترافي والتسجيل العادي، وكذلك بين الذكور والإناث، حيث كانت مساحات المضلعات الصوتية الناتجة عن التسجيل العادي أكبر من تلك الناتجة عن التسجيل الاحترافي.

  4. ما هي التوصيات التي قدمتها الدراسة لتحسين قاعدة البيانات الصوتية؟

    توصي الدراسة بتوسيع قاعدة البيانات الصوتية لتشمل تسجيلات لأشخاص من فئات عمرية مختلفة ودراسة تأثير العمر على المجال الصوتي، وكذلك بناء قاعدة بيانات للأصوات الهاتفية للمتحدثين السوريين.


المراجع المستخدمة
STANEK, M., SIGMUND, M. Speaker Dependent Changes in Formants Based on Normalization of Vowel Triangle. In Proc. 23rd International Conference RADIOELEKTRONIKA. Pardubice. Czech Republic, 2013, pp. 337-341
ALGHAMDI, M. Analysis, Synthesis and Perception of Voicing in Arabic. Al- ToubahBookshop, Riyadh. 2004, P. 50
KENSTOWICZ, M. Parametric variation and accent in the Arabic dialects, 1983, CLS19: 205-213
قيم البحث

اقرأ أيضاً

تمَّ في هذا البحث اقتراح معيار لدراسة خصائص إشارة الصوت لكل من صنفي المدخنين و غير المدخنين، إذ تمَّ بناء قاعدة بيانات تضم ملفات صوتية تعود إلى 12 شخص سوري (6 أشخاص مدخنين و 6 أشخاص غير مدخنين)، تتراوح أعمار جميع الأشخاص بين 35 و 45 عام، جميعهم ذكور و يعيشون في مناطق ريفية متجاورة. استغرقت عملية تسجيل الملفات الصوتية ثلاث ساعات، حيث لفظ جميع المتحدثين جملة / أَنَاْ أُحِبُّ سُوْرِيْة /، و هي جملة غنية صوتياً تشمل جميع الأحرف الصوتية الطويلة (الألف و الواو و الياء) و الحروف الصوتية القصيرة (الفتحة و الضمة و الكسرة). اعتماداً على التسجيلات الناتجة تمَّ توليد المثلثات الصوتية الطويلة و القصيرة، و هي مثلثات هندسية رؤوسها تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات (Formants)، حيث تمَّ توليد المثلثات الصوتية الطويلة (AAIIUU) في 10 مستويات، و كذلك المثلثات الصوتية القصيرة (AIU) في 10 مستويات؛ و بذلك نتج 20 مثلث صوتي لكل شخص. تمَّ في كل مستوي حساب المسافة بين جميع مراكز المثلثات الصوتية و اختيار المسافة الأدنى (d)، فيكون المستوي ذو القيمة الأعظمية للمسافة (d) هو المستوي الممثل للمثلث الصوتي الأنسب لتمييز المدخنين من غير المدخنين، و قد تحقق ذلك بالنسبة للمثلثين AIU35 و .AAIIUU45.
تكمن أهمية البحث في ضرورة مواكبة التطور التكنولوجي لنظم الحاسب، والتقنيات و الأساليب الحديثة خاصة نظم المعلومات الجغ ا رفية في جمع و تخزين و تحليل و إخ ا رج المعلومات المكانية و ربطها بالمعلومات الوصفية ووضع النماذج و السيناريوهات أمام المخططين و صانعي الق ا رر لتساعدهم في عمليات التخطيط و إيجاد الحلول المناسبة لمختلف المشاكل .
يعرض هذا البحث طريقة دمج قاعدة بيانات مع Jgroup بالاعتماد على Hibernate التي تمثّل إحدى أدوات مقابلة الغرض العلائقية. كما يقارن بين أداء Jgroup المدمجة مع Hibernate و أداء RMI المدمجة مع Hibernate تظهر النتائج تفوق أداء Jgroup/Hibernate على أداء RMI/Hibernate مع تزايد عدد الزبائن.
يهدف البحث إلى دراسة كيفية إضافة عناصر جديدة إلى قاعدة بيانات برنامج Multisim أو كيفية نمذجة عنصر باستخدام اللغة البرمجية C++ من أجل استخدام هذا العنصر فيما بعد في تصميم و تركيب الدارات و الأجهزة الالكترونية. تحتوي قاعدة بيانات Multisim نماذج مدمجة لأغلب الأجهزة الالكترونية، و تهدف الدراسة إلى وضع أسس و طريقة لنمذجة العناصر الالكترونية غير الموجودة ضمن قاعدة بيانات برنامج Multisim (أو موجودة و بقيم مغايرة), و التي نحتاجها أثناء استخدام هذا البرنامج في عملية النمذجة و المحاكاة لدارة ما. و قد تم اقتراح أسلوب نمذجة الشيفرة Code modeling للوصول إلى هذا الهدف, و يعتمد هذا الأسلوب على سلوك الجهاز أو العنصر المنمذج. و تبين الدراسة كيفية إنشاء نموذج شيفرة Code model لمكثف بقيم محددة و مغايرة للموجودة ضمن قاعدة البيانات و إضافته إليها.
تعاني معظم شركات المقاولات من ضعف التنسيق بين المشاريع التني تنفذها في وقت واحد , وفي سوريا يزداد الوضع سوءاً لغياب تطبيق المنهجيات الحديثة في إدارة المشاريع مما يسبب هدرا كبيراً في الوقت والجهد لاسيما لتنظيم واسترجاع عشرات الوثائق المتعلقة بالتخطيط والمتابعة وبالتالي زيادة في الزمن والكلفة وضعف في الجودة .
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا