ترغب بنشر مسار تعليمي؟ اضغط هنا

نحو نظام لتركيب الكلام باللغة العربية من نصوص في المعهد العالي للعلوم التطبيقية و التكنولوجيا باستعمال الضم لأنصاف مقاطع صوتية و تنغيم طبيعي

Toward a HIAST Arabic Text to Speech System Using Semi Syllables Concatenation and Natural Prosody

1623   1   87   0 ( 0 )
 تاريخ النشر 2018
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم في هذا البحث مركب كلام للغة العربية ذا جودة عالية، باستعمال طريقة الضم لأنصاف المقاطع الصوتية. يتألف العمل من سبع مراحل أساسية: بناء القاموس الصوتي لأنصاف المقاطع الصوتية، بناء مكون معالجة اللغة الطبيعية الذي يتكون من وحدة المعالجة المسبقة للنص واستعمال نظام خبير لتحويل النص المشكول إلى مقابله الصوتي، بناء نظام خبير يعتمد على القواعد لتقطيع سلسلة الصوتيمات لكل من الكلمات و العبارات في الجمل إلى مقاطعها الصوتية و إسناد واصفات كل مقطع وفق خوارزمية خاصة باللغة العربية، دراسة تحليلية صوتية للنبر في الحديث المتواصل لاستخراج أثر المقاطع المنبورة على موسطات التنغيم على مستوى الكلمات و العبارات.


ملخص البحث
تقدم هذه الأطروحة نظامًا لتركيب الكلام باللغة العربية باستخدام تقنية ضم أنصاف المقاطع الصوتية. يتألف النظام من سبع مراحل أساسية تشمل بناء قاموس صوتي لأنصاف المقاطع، ومعالجة اللغة الطبيعية، ونظام خبير لتقطيع الصوتيمات، ودراسة تحليلية صوتية للنبر، ونظام خبير لإسناد النبر، ومعالجة الإشارة الرقمية باستخدام تقنية TD-PSOLA، واختبار النظام على مدونات نصية وصوتية. أظهرت النتائج دقة عالية في التقطيع وجودة عالية للكلام المركب مقارنةً بمركبات الكلام الأخرى المتاحة للغة العربية. كما تضمنت الدراسة تحليلًا صوتيًا للنبر في الحديث المتواصل، حيث تبين أن النبر يرتبط بشكل كبير بموسط المدة والمطال، وتميزت قواعد إسناد النبر بثلاث درجات: النبر الأولي، والثانوي، والمعدوم. كما جرى اختبار وضوح وفهم وطبيعية الكلام المركب باستخدام مدونات نصية متنوعة، وأظهرت النتائج تحسنًا ملحوظًا في جودة الكلام المركب بعد إضافة النبر.
قراءة نقدية
دراسة نقدية: تعتبر هذه الأطروحة خطوة مهمة في مجال تركيب الكلام باللغة العربية، حيث تقدم نظامًا متكاملًا يعتمد على ضم أنصاف المقاطع الصوتية وتوليد التنغيم الطبيعي. ومع ذلك، يمكن الإشارة إلى بعض النقاط التي قد تحتاج إلى تحسين. أولاً، لم يتم تضمين مشكل آلي للنصوص غير المشكولة، مما قد يقلل من فعالية النظام في التطبيقات العملية. ثانيًا، على الرغم من أن النظام أظهر تحسنًا في جودة الكلام المركب، إلا أن هناك مجالًا لتحسين التنغيم على مستوى الجمل بشكل آلي. أخيرًا، يمكن أن يكون هناك توجه نحو دمج النظام مع تقنيات تعلم الآلة الحديثة لتحسين دقة النتائج وزيادة طبيعية الكلام المركب.
أسئلة حول البحث
  1. ما هي تقنية ضم أنصاف المقاطع الصوتية المستخدمة في هذه الأطروحة؟

    تقنية ضم أنصاف المقاطع الصوتية هي طريقة تستخدم لدمج أنصاف المقاطع الصوتية لتوليد الكلام المركب، حيث يتم تقسيم الكلمات إلى أنصاف مقاطع صوتية ثم دمجها باستخدام تقنية TD-PSOLA لتوليد الكلام المركب بجودة عالية.

  2. ما هي المراحل الأساسية التي يتألف منها نظام تركيب الكلام في هذه الأطروحة؟

    يتألف النظام من سبع مراحل أساسية تشمل بناء قاموس صوتي لأنصاف المقاطع، ومعالجة اللغة الطبيعية، ونظام خبير لتقطيع الصوتيمات، ودراسة تحليلية صوتية للنبر، ونظام خبير لإسناد النبر، ومعالجة الإشارة الرقمية باستخدام تقنية TD-PSOLA، واختبار النظام على مدونات نصية وصوتية.

  3. ما هي النتائج التي أظهرتها الدراسة التحليلية الصوتية للنبر في الحديث المتواصل؟

    أظهرت الدراسة التحليلية الصوتية للنبر أن النبر يرتبط بشكل كبير بموسط المدة والمطال، وتميزت قواعد إسناد النبر بثلاث درجات: النبر الأولي، والثانوي، والمعدوم.

  4. ما هي التحديات التي تواجه نظام تركيب الكلام المطور في هذه الأطروحة؟

    من التحديات التي تواجه النظام عدم تضمين مشكل آلي للنصوص غير المشكولة، والحاجة إلى تحسين التنغيم على مستوى الجمل بشكل آلي، بالإضافة إلى إمكانية دمج النظام مع تقنيات تعلم الآلة الحديثة لتحسين دقة النتائج وزيادة طبيعية الكلام المركب.


المراجع المستخدمة
A. A. Almisreb A. F. Abidin, N. M. Tahir An acoustic investigation of Arabic vowels pronounced by Malay speakers [Article] // Journal of King Saud University – Computer and Information Sciences . - [s.l.] : Conference: 2016 IEEE 12th International Colloquium on Signal Processing & Its Applications (CSPA), 2016. - 28, 148–156
A. Al.Shalaby O. Dakkak, N.Alawa Automatic Prosody Generation for Arabic Text To Speech Systems [Article] // Damascus University Journal for the Basic Sciences. - 2013. - Vol. 29 - No. 1
A. Almisreb A. F. Abidin, N. Md .Tahir An acoustic investigation of Arabic vowels pronounced by Malay speakers [Article] // Journal of King Saud University - Computer and Information Sciences. - 2016. - Vol.(28) Issue(2), Pages 148-156
قيم البحث

اقرأ أيضاً

الهدف الأساسي من هذا البحث دعم تركيب الكلام من نصوص باللغة العربية بتنغيم طبيعي؛ و ذلك بالاعتماد على تحليل لغوي للنصوص المراد تركيبها و توليد قواعد تنغيم يجري استنتاجها من تحليل إشارات مسجلة لمختلف أنواع الجمل باللغة العربية. جرى، بالاستعانة بخبير ل غوي، حصر مختلف أنواع الجمل الخبرية و الإنشائية باللغة العربية، ثم إنشاء مدونة نصية تتضمن معظم أنواع هذه الجمل. تضمنت المدونة قرابة 2500 جملة. بعد ذلك جرى تسجيل هذه الجمل صوتياً بالتنغيم الطبيعي ثم بسرد مصطنع خال من التنغيم. في مرحلة لاحقة جرى تحليل إشارات كل نوع من أنواع الجمل بالتنغيم الطبيعي و بالنسخة الخالية من التنغيم لنمذجة أثر التنغيم الطبيعي في محددات الإشارة، و وضع قواعد لتوليد هذا التنغيم آلياً. نعرض في هذا البحث نتائج هذه الدراسة على جمل النفي الخبرية و تطبيق النتائج على كلام مركب باستخدام الأداة المفتوحة المصدر MBROLA. كما يمكن استخدام هذه النتائج مع أي مركب كلام عربي بموسطات، نأمل مستقبلاً، تنفيذ . توليد التنغيم على مركب كلام بأنصاف مقاطع يجري تطويره حالياً، في المعهد العالي للعلوم التطبيقية و التكنولوجيا.
نعرض في هذا البحث المنهجية المعتمدة في بناء منصة ArOntoLearn, و هي بيئة عمل تساعد على بناء أنطولوجية عربية اعتماداً على النصوص في الوب، و أهم سمات هذه البيئة أنها تدعم اللغة العربية و تستخدم المعرفة السابقة في إجرائيات التعلم، فضلاً عن أنها تمثل الأن طولوجية الناتجة باستخدام نموذج الأنطولوجية الاحتمالي (Probabilistic Ontology Model (POM الذي يمكن ترجمته إلى أي صيغة تمثيل للمعرفة. يقوم النظام بتحليل الموارد النصية العربية، يقابلها مع نماذج مفرادتية-نحوية بهدف تعّلم مفاهيم و علاقات جديدة. إن دعم اللغة العربية ليس سهلاً نظراً لكون أدوات المعالجة اللغوية المتوافرة غير فعالة كفاية لمعالجة النصوص العربية غير المشكولة التي كذلك نادراً ما تتضمن علامات الترقيم الصحيحة المساعدة على التحليل الصحيح للجمل. لذلك حاولنا بناء بيئة عمل مرنة يمكن إعدادها بسهولة بحيث تُعدلُ أدوات التحليل المستخدمة فيها و تُستَبدلُ بأخرى أكثر تطوراً عند توافرها.
تجذب تصنيف المعنويات والكشف عن السخرية الكثير من الاهتمام من قبل مجتمع البحوث NLP. ومع ذلك، فإن حل هاتين المشكلتين باللغة العربية وعلى أساس بيانات الشبكة الاجتماعية (I.E.، Twitter) لا يزال مصلحة أقل. في هذه الورقة نقدم حلولا مخصصة لتصنيف المعنويات وم هام الكشف عن السخرية التي تم تقديمها كجزء من مهمة مشتركة من قبل أبو فرحة وآخرون. (2021). نقوم بضبط نماذج المحولات الحالية المحولات الحالية لاحتياجاتنا. بالإضافة إلى ذلك، نستخدم مجموعة متنوعة من تقنيات التعلم الآلي مثل أخذ العينات الأولية والتكبير والتعبئة والتغليف واستخدام ميزات META لتحسين أداء النماذج. نحن نحقق درجة F1 من 0.75 على مشكلة تصنيف المعنويات حيث يتم حساب درجة F1 على الفصول الإيجابية والسلبية (لا يتم أخذ الفصل المحايد في الاعتبار). نحن نحقق درجة F1 من 0.66 فوق مشكلة الكشف عن السخرية حيث يتم حساب درجة F1 عبر الفئة الساخرة فقط. في كلتا الحالتين، يتم تقييم النتائج المذكورة أعلاه على Arsarcasm-V2 - مجموعة بيانات ممتدة من Arsarcasm (Farha و Magdy، 2020) تم تقديمها كجزء من المهمة المشتركة. هذا يعكس تحسنا لتحقيق أحدث النتائج في كلتا المهام.
هدفت الدراسة إلى تعرف الأداء اللغوي لمعلمي اللغة العربية و علاقتها باتجاهاتهم نحو تدريس المادة، و تكونت عينة الدراسة من (40) معلماً و معلمة من معلمي و معلمات اللغة العربية في المدارس التابعة لمديرية التربية و التعليم لمنطقة البادية الشمالية الشرقية ف ي الاردن. و استُخدم المنهج الوصفي التحليلي، و جرى إعداد أداتين الأولى بطاقة ملاحظة، و الثانية مقياس اتجاهات نحو تدريس المادة. و أظهرت نتائج الدراسة أن الأداء اللغوي لمعلمي اللغة العربية بمستوى (متوسط)، و أن اتجاهات المعلمين نحو تدريس المادة جاءت بمستوى (متوسط) أيضاً و دل ذلك على وجود علاقة قوية بين الأداء اللغوي و الاتجاه نحو تدريس المادة.
تم تطوير نظام خبير لإعراب مفردات الجمل العربية دون تشكيل. يقوم النظام أولاً بإيجاد تصريف الكلمات و نوعها باستخدام أداة (Microsoft (ATK، ويستمد خبرته من قواعد اللغة العربية في إيجاد إعراب مفردات الجمل الإسمية. استجاب النظام بشكل صحيح بنسبة جيدة جداً و تمت مقارنة النتائج الصادرة عنه مع نتائج خبير باللغة العربية.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا