ترغب بنشر مسار تعليمي؟ اضغط هنا

تحويل النصوص العربية من رموز كتابية

Text-to-Phonemes in Arabic

3149   0   54   0 ( 0 )
 تاريخ النشر 2003
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعد هذا البحث مرحلة من مراحل بناء نظام تركيب الكلام باللغة العربية، و هي مرحلة تحويل النصوص العربية من رموز كتابية إلى رموز صوتية. جرى في هذه المرحلة بناء نظام متكامل خاص باللغة العربية لإجراء التحويل. اعتمد نظام التحويل من رموز كتابية إلى رموز صوتية أساسًا على بنية النظام Orthographic-Phonetic ) TOPH (Transcription الذي يقوم بتحويل الرموز الكتابية إلى رموز صوتية باللغة الفرنسية، و الذي يعتمد مبدأ استخدام القواعد في ذلك.


ملخص البحث
يتناول هذا البحث مرحلة من مراحل بناء نظام توليد الكلام العربي، وهي مرحلة "تحويل النصوص إلى رموز صوتية". تم بناء نظام كامل لتحويل النصوص إلى رموز صوتية للغة العربية باستخدام طريقة TOPH (التحويل الكتابي-الصوتي)، وهي طريقة مستخدمة لتحويل النصوص الفرنسية إلى رموز صوتية. كما تم كتابة قواعد تحويل النصوص العربية إلى رموز صوتية باستخدام لغة TOPH الرسمية. يقدم البحث أمثلة تطبيقية على كيفية تطبيق قواعد TOPH على اللغة العربية، مثل حذف اللام الشمسية، همزة الوصل، وحروف المد، والتقاء الساكنين. يهدف النظام إلى تحسين دقة تحويل النصوص العربية إلى رموز صوتية، مما يسهم في تطوير أنظمة توليد الكلام باللغة العربية.
قراءة نقدية
دراسة نقدية: على الرغم من أن البحث يقدم نظامًا شاملاً لتحويل النصوص العربية إلى رموز صوتية باستخدام طريقة TOPH، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، لم يتم تقديم تحليل كافٍ حول كيفية تأثير الفروق الصوتية بين اللغة الفرنسية والعربية على دقة النظام. ثانيًا، يمكن أن يكون هناك حاجة إلى مزيد من الاختبارات العملية لتقييم أداء النظام في سياقات مختلفة من النصوص العربية. أخيرًا، يمكن أن يكون هناك اهتمام أكبر بتقديم مقارنة بين نظام TOPH وأنظمة أخرى لتحويل النصوص إلى رموز صوتية في اللغة العربية لتوضيح الفوائد والعيوب النسبية لكل نظام.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من البحث؟

    الهدف الرئيسي هو بناء نظام لتحويل النصوص العربية إلى رموز صوتية كجزء من نظام توليد الكلام العربي.

  2. ما هي الطريقة المستخدمة لتحويل النصوص إلى رموز صوتية في هذا البحث؟

    تم استخدام طريقة TOPH (التحويل الكتابي-الصوتي) لتحويل النصوص إلى رموز صوتية.

  3. ما هي بعض الأمثلة على تطبيق قواعد TOPH على اللغة العربية؟

    بعض الأمثلة تشمل حذف اللام الشمسية، همزة الوصل، وحروف المد، والتقاء الساكنين.

  4. ما هي النقاط التي يمكن تحسينها في البحث؟

    يمكن تحسين البحث من خلال تقديم تحليل كافٍ للفروق الصوتية بين الفرنسية والعربية، إجراء اختبارات عملية إضافية، وتقديم مقارنة بين نظام TOPH وأنظمة أخرى لتحويل النصوص إلى رموز صوتية.


المراجع المستخدمة
Dakkak,Ghneim ٩٩] Oumayma Aldakkak, Nada Ghneim, "Towards Man- Machine Communication in Arabic", Syria-Lebanese Conference, Damascus University
[البواب، ميرعلم، والطيان ٨٤ ] مروان البواب، يحيى ميرعلم، محمد حسان الطيان، إشراف محمد نشرة داخلية، مركز الدراسات والبحوث العلمية، دمشق، ،« الكتابة الصوتية العربية » مراياتي . سورية، ١٩٨4
قيم البحث

اقرأ أيضاً

نقدم في هذا البحث خوارزمية لتجميع نصوص اللغة العربية. حيث نفذنا الخوارزمية على 5 أنطولوجيات عبر برنامج بلغة الجافا، ثم عالجنا النصوص بحيث حصلنا على 338667 مفردة مع أوزانها المقابلة لكل أنطولوجيا. و قد أثبتت الخوارزمية فعاليتها في تحسين أداء المصنفا ت التي تم تجربتها في هذه الدراسة و هي (NB,SVM) مقارنة مع نتائج مصنفات اللغة العربية السابقة.
قدمنا في هذا البحث دراسة مفصلة لطرق التنقيب في البيانات النصية و الإمكانيات المتوفرة في لغة الاستعلام الإجرائية PL/SQL التي تتعامل مع قواعد بيانات أوراكل الغرضية للقيام بذلك. و من ثم قمنا ببناء نموذج تنقيب يعمل على تصنيف وثائق النصوص العربية باست خدام خوارزمية SVM لفهرستها و من ثم تحويلها إلى جداول بيانات مدخلة في جداول الحالة لتصنيفها باستخدام خوارزمية Naïve Bayes و قدمنا الاستنتاجات و التوصيات بعد تقييم النتائج التي حصلنا عليها.
نعرض في هذا البحث المنهجية المعتمدة في بناء منصة ArOntoLearn, و هي بيئة عمل تساعد على بناء أنطولوجية عربية اعتماداً على النصوص في الوب، و أهم سمات هذه البيئة أنها تدعم اللغة العربية و تستخدم المعرفة السابقة في إجرائيات التعلم، فضلاً عن أنها تمثل الأن طولوجية الناتجة باستخدام نموذج الأنطولوجية الاحتمالي (Probabilistic Ontology Model (POM الذي يمكن ترجمته إلى أي صيغة تمثيل للمعرفة. يقوم النظام بتحليل الموارد النصية العربية، يقابلها مع نماذج مفرادتية-نحوية بهدف تعّلم مفاهيم و علاقات جديدة. إن دعم اللغة العربية ليس سهلاً نظراً لكون أدوات المعالجة اللغوية المتوافرة غير فعالة كفاية لمعالجة النصوص العربية غير المشكولة التي كذلك نادراً ما تتضمن علامات الترقيم الصحيحة المساعدة على التحليل الصحيح للجمل. لذلك حاولنا بناء بيئة عمل مرنة يمكن إعدادها بسهولة بحيث تُعدلُ أدوات التحليل المستخدمة فيها و تُستَبدلُ بأخرى أكثر تطوراً عند توافرها.
الهدف الأساسي من هذا البحث دعم تركيب الكلام من نصوص باللغة العربية بتنغيم طبيعي؛ و ذلك بالاعتماد على تحليل لغوي للنصوص المراد تركيبها و توليد قواعد تنغيم يجري استنتاجها من تحليل إشارات مسجلة لمختلف أنواع الجمل باللغة العربية. جرى، بالاستعانة بخبير ل غوي، حصر مختلف أنواع الجمل الخبرية و الإنشائية باللغة العربية، ثم إنشاء مدونة نصية تتضمن معظم أنواع هذه الجمل. تضمنت المدونة قرابة 2500 جملة. بعد ذلك جرى تسجيل هذه الجمل صوتياً بالتنغيم الطبيعي ثم بسرد مصطنع خال من التنغيم. في مرحلة لاحقة جرى تحليل إشارات كل نوع من أنواع الجمل بالتنغيم الطبيعي و بالنسخة الخالية من التنغيم لنمذجة أثر التنغيم الطبيعي في محددات الإشارة، و وضع قواعد لتوليد هذا التنغيم آلياً. نعرض في هذا البحث نتائج هذه الدراسة على جمل النفي الخبرية و تطبيق النتائج على كلام مركب باستخدام الأداة المفتوحة المصدر MBROLA. كما يمكن استخدام هذه النتائج مع أي مركب كلام عربي بموسطات، نأمل مستقبلاً، تنفيذ . توليد التنغيم على مركب كلام بأنصاف مقاطع يجري تطويره حالياً، في المعهد العالي للعلوم التطبيقية و التكنولوجيا.
يندرج هذا البحث في إطار الكشف الآلي لعمليات الإنتحال في النصوص المدوّنة باللغة العربية وتقدّم هذه الورقة طريقة مبتكرة تعتمد على استخراج الكلمات الهامة في النص المراد كشفه ومن ثمّ تكوين سلاسل لغوية حسب تواترها في النص. وباستعمال محركات البحث يمكن التث بت من وجود هذه السلاسل اللغوية في نصوص أخرى. في مرحلة ثانية قمنا باستعمال الترجمة الآلية للسلاسل اللغوية قصد استخراج السلاسل المرادفة باللغة الإنجليزية ومن ثمّ استعمال محركات البحث لاستخراج النصوص المدوّنة باللغة الإنجليزية والتي تتطابق مع السلاسل بعد ترجمتها. وتقدّم هذه الورقة العلمية برنامج الكاشف وهو برنامج لكشف حالات الإنتحال وقد قمنا بتقييم البرنامج على مدونة من النصوص العربية وأبرزت النتائج كفاءة الطريقة المتبعة
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا