ترغب بنشر مسار تعليمي؟ اضغط هنا

نحو نظام لتركيب الكلام باللغة العربية من نصوص في المعهد العالي للعلوم التطبيقية و التكنولوجيا باستعمال الضم لأنصاف مقاطع صوتية و تنغيم طبيعي

Toward a HIAST Arabic Text to Speech System Using Semi Syllables Concatenation and Natural Prosody

1419   1   87   0 ( 0 )
 تاريخ النشر 2018
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم في هذا البحث مركب كلام للغة العربية ذا جودة عالية، باستعمال طريقة الضم لأنصاف المقاطع الصوتية. يتألف العمل من سبع مراحل أساسية: بناء القاموس الصوتي لأنصاف المقاطع الصوتية، بناء مكون معالجة اللغة الطبيعية الذي يتكون من وحدة المعالجة المسبقة للنص واستعمال نظام خبير لتحويل النص المشكول إلى مقابله الصوتي، بناء نظام خبير يعتمد على القواعد لتقطيع سلسلة الصوتيمات لكل من الكلمات و العبارات في الجمل إلى مقاطعها الصوتية و إسناد واصفات كل مقطع وفق خوارزمية خاصة باللغة العربية، دراسة تحليلية صوتية للنبر في الحديث المتواصل لاستخراج أثر المقاطع المنبورة على موسطات التنغيم على مستوى الكلمات و العبارات.

المراجع المستخدمة
A. A. Almisreb A. F. Abidin, N. M. Tahir An acoustic investigation of Arabic vowels pronounced by Malay speakers [Article] // Journal of King Saud University – Computer and Information Sciences . - [s.l.] : Conference: 2016 IEEE 12th International Colloquium on Signal Processing & Its Applications (CSPA), 2016. - 28, 148–156
A. Al.Shalaby O. Dakkak, N.Alawa Automatic Prosody Generation for Arabic Text To Speech Systems [Article] // Damascus University Journal for the Basic Sciences. - 2013. - Vol. 29 - No. 1
A. Almisreb A. F. Abidin, N. Md .Tahir An acoustic investigation of Arabic vowels pronounced by Malay speakers [Article] // Journal of King Saud University - Computer and Information Sciences. - 2016. - Vol.(28) Issue(2), Pages 148-156
قيم البحث

اقرأ أيضاً

الهدف الأساسي من هذا البحث دعم تركيب الكلام من نصوص باللغة العربية بتنغيم طبيعي؛ و ذلك بالاعتماد على تحليل لغوي للنصوص المراد تركيبها و توليد قواعد تنغيم يجري استنتاجها من تحليل إشارات مسجلة لمختلف أنواع الجمل باللغة العربية. جرى، بالاستعانة بخبير ل غوي، حصر مختلف أنواع الجمل الخبرية و الإنشائية باللغة العربية، ثم إنشاء مدونة نصية تتضمن معظم أنواع هذه الجمل. تضمنت المدونة قرابة 2500 جملة. بعد ذلك جرى تسجيل هذه الجمل صوتياً بالتنغيم الطبيعي ثم بسرد مصطنع خال من التنغيم. في مرحلة لاحقة جرى تحليل إشارات كل نوع من أنواع الجمل بالتنغيم الطبيعي و بالنسخة الخالية من التنغيم لنمذجة أثر التنغيم الطبيعي في محددات الإشارة، و وضع قواعد لتوليد هذا التنغيم آلياً. نعرض في هذا البحث نتائج هذه الدراسة على جمل النفي الخبرية و تطبيق النتائج على كلام مركب باستخدام الأداة المفتوحة المصدر MBROLA. كما يمكن استخدام هذه النتائج مع أي مركب كلام عربي بموسطات، نأمل مستقبلاً، تنفيذ . توليد التنغيم على مركب كلام بأنصاف مقاطع يجري تطويره حالياً، في المعهد العالي للعلوم التطبيقية و التكنولوجيا.
نعرض في هذا البحث المنهجية المعتمدة في بناء منصة ArOntoLearn, و هي بيئة عمل تساعد على بناء أنطولوجية عربية اعتماداً على النصوص في الوب، و أهم سمات هذه البيئة أنها تدعم اللغة العربية و تستخدم المعرفة السابقة في إجرائيات التعلم، فضلاً عن أنها تمثل الأن طولوجية الناتجة باستخدام نموذج الأنطولوجية الاحتمالي (Probabilistic Ontology Model (POM الذي يمكن ترجمته إلى أي صيغة تمثيل للمعرفة. يقوم النظام بتحليل الموارد النصية العربية، يقابلها مع نماذج مفرادتية-نحوية بهدف تعّلم مفاهيم و علاقات جديدة. إن دعم اللغة العربية ليس سهلاً نظراً لكون أدوات المعالجة اللغوية المتوافرة غير فعالة كفاية لمعالجة النصوص العربية غير المشكولة التي كذلك نادراً ما تتضمن علامات الترقيم الصحيحة المساعدة على التحليل الصحيح للجمل. لذلك حاولنا بناء بيئة عمل مرنة يمكن إعدادها بسهولة بحيث تُعدلُ أدوات التحليل المستخدمة فيها و تُستَبدلُ بأخرى أكثر تطوراً عند توافرها.
تجذب تصنيف المعنويات والكشف عن السخرية الكثير من الاهتمام من قبل مجتمع البحوث NLP. ومع ذلك، فإن حل هاتين المشكلتين باللغة العربية وعلى أساس بيانات الشبكة الاجتماعية (I.E.، Twitter) لا يزال مصلحة أقل. في هذه الورقة نقدم حلولا مخصصة لتصنيف المعنويات وم هام الكشف عن السخرية التي تم تقديمها كجزء من مهمة مشتركة من قبل أبو فرحة وآخرون. (2021). نقوم بضبط نماذج المحولات الحالية المحولات الحالية لاحتياجاتنا. بالإضافة إلى ذلك، نستخدم مجموعة متنوعة من تقنيات التعلم الآلي مثل أخذ العينات الأولية والتكبير والتعبئة والتغليف واستخدام ميزات META لتحسين أداء النماذج. نحن نحقق درجة F1 من 0.75 على مشكلة تصنيف المعنويات حيث يتم حساب درجة F1 على الفصول الإيجابية والسلبية (لا يتم أخذ الفصل المحايد في الاعتبار). نحن نحقق درجة F1 من 0.66 فوق مشكلة الكشف عن السخرية حيث يتم حساب درجة F1 عبر الفئة الساخرة فقط. في كلتا الحالتين، يتم تقييم النتائج المذكورة أعلاه على Arsarcasm-V2 - مجموعة بيانات ممتدة من Arsarcasm (Farha و Magdy، 2020) تم تقديمها كجزء من المهمة المشتركة. هذا يعكس تحسنا لتحقيق أحدث النتائج في كلتا المهام.
هدفت الدراسة إلى تعرف الأداء اللغوي لمعلمي اللغة العربية و علاقتها باتجاهاتهم نحو تدريس المادة، و تكونت عينة الدراسة من (40) معلماً و معلمة من معلمي و معلمات اللغة العربية في المدارس التابعة لمديرية التربية و التعليم لمنطقة البادية الشمالية الشرقية ف ي الاردن. و استُخدم المنهج الوصفي التحليلي، و جرى إعداد أداتين الأولى بطاقة ملاحظة، و الثانية مقياس اتجاهات نحو تدريس المادة. و أظهرت نتائج الدراسة أن الأداء اللغوي لمعلمي اللغة العربية بمستوى (متوسط)، و أن اتجاهات المعلمين نحو تدريس المادة جاءت بمستوى (متوسط) أيضاً و دل ذلك على وجود علاقة قوية بين الأداء اللغوي و الاتجاه نحو تدريس المادة.
تم تطوير نظام خبير لإعراب مفردات الجمل العربية دون تشكيل. يقوم النظام أولاً بإيجاد تصريف الكلمات و نوعها باستخدام أداة (Microsoft (ATK، ويستمد خبرته من قواعد اللغة العربية في إيجاد إعراب مفردات الجمل الإسمية. استجاب النظام بشكل صحيح بنسبة جيدة جداً و تمت مقارنة النتائج الصادرة عنه مع نتائج خبير باللغة العربية.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا