نقدم في هذا البحث مركب كلام للغة العربية ذا جودة عالية، باستعمال طريقة الضم لأنصاف المقاطع
الصوتية. يتألف العمل من سبع مراحل أساسية: بناء القاموس الصوتي لأنصاف المقاطع الصوتية،
بناء مكون معالجة اللغة الطبيعية الذي يتكون من وحدة المعالجة المسبقة للنص واستعمال نظام خبير لتحويل النص المشكول إلى مقابله الصوتي، بناء نظام خبير يعتمد على القواعد لتقطيع سلسلة الصوتيمات لكل من الكلمات و العبارات في الجمل إلى مقاطعها الصوتية و إسناد واصفات كل مقطع وفق خوارزمية خاصة باللغة العربية، دراسة تحليلية صوتية للنبر في الحديث المتواصل لاستخراج أثر المقاطع المنبورة على موسطات التنغيم على مستوى الكلمات و العبارات.
In the present work, we present our Arabic Semi-Syllable Synthesizer. The work consists of seven steps: (1) building a Semi-Syllable Speech Database for Arabic Semi-Syllable Synthesizer, (2) building the Natural Language Processing Module which comprises a Text Pre-processing Module and a Text to Phoneme conversion using Arabic Transcription from Orthographic to Phonemes, (3) followed by a Phoneme to Semi-Syllables Mapping using a Syllabification Expert System, (4) an Acoustic Word Stress Analysis for Continuous Arabic Speech based on the three prosodic parameters (fundamental frequency, intensity, duration) in order to detect stressed syllables.
Artificial intelligence review:
Research summary
تقدم هذه الأطروحة نظامًا لتركيب الكلام باللغة العربية باستخدام تقنية ضم أنصاف المقاطع الصوتية. يتألف النظام من سبع مراحل أساسية تشمل بناء قاموس صوتي لأنصاف المقاطع، ومعالجة اللغة الطبيعية، ونظام خبير لتقطيع الصوتيمات، ودراسة تحليلية صوتية للنبر، ونظام خبير لإسناد النبر، ومعالجة الإشارة الرقمية باستخدام تقنية TD-PSOLA، واختبار النظام على مدونات نصية وصوتية. أظهرت النتائج دقة عالية في التقطيع وجودة عالية للكلام المركب مقارنةً بمركبات الكلام الأخرى المتاحة للغة العربية. كما تضمنت الدراسة تحليلًا صوتيًا للنبر في الحديث المتواصل، حيث تبين أن النبر يرتبط بشكل كبير بموسط المدة والمطال، وتميزت قواعد إسناد النبر بثلاث درجات: النبر الأولي، والثانوي، والمعدوم. كما جرى اختبار وضوح وفهم وطبيعية الكلام المركب باستخدام مدونات نصية متنوعة، وأظهرت النتائج تحسنًا ملحوظًا في جودة الكلام المركب بعد إضافة النبر.
Critical review
دراسة نقدية: تعتبر هذه الأطروحة خطوة مهمة في مجال تركيب الكلام باللغة العربية، حيث تقدم نظامًا متكاملًا يعتمد على ضم أنصاف المقاطع الصوتية وتوليد التنغيم الطبيعي. ومع ذلك، يمكن الإشارة إلى بعض النقاط التي قد تحتاج إلى تحسين. أولاً، لم يتم تضمين مشكل آلي للنصوص غير المشكولة، مما قد يقلل من فعالية النظام في التطبيقات العملية. ثانيًا، على الرغم من أن النظام أظهر تحسنًا في جودة الكلام المركب، إلا أن هناك مجالًا لتحسين التنغيم على مستوى الجمل بشكل آلي. أخيرًا، يمكن أن يكون هناك توجه نحو دمج النظام مع تقنيات تعلم الآلة الحديثة لتحسين دقة النتائج وزيادة طبيعية الكلام المركب.
Questions related to the research
-
ما هي تقنية ضم أنصاف المقاطع الصوتية المستخدمة في هذه الأطروحة؟
تقنية ضم أنصاف المقاطع الصوتية هي طريقة تستخدم لدمج أنصاف المقاطع الصوتية لتوليد الكلام المركب، حيث يتم تقسيم الكلمات إلى أنصاف مقاطع صوتية ثم دمجها باستخدام تقنية TD-PSOLA لتوليد الكلام المركب بجودة عالية.
-
ما هي المراحل الأساسية التي يتألف منها نظام تركيب الكلام في هذه الأطروحة؟
يتألف النظام من سبع مراحل أساسية تشمل بناء قاموس صوتي لأنصاف المقاطع، ومعالجة اللغة الطبيعية، ونظام خبير لتقطيع الصوتيمات، ودراسة تحليلية صوتية للنبر، ونظام خبير لإسناد النبر، ومعالجة الإشارة الرقمية باستخدام تقنية TD-PSOLA، واختبار النظام على مدونات نصية وصوتية.
-
ما هي النتائج التي أظهرتها الدراسة التحليلية الصوتية للنبر في الحديث المتواصل؟
أظهرت الدراسة التحليلية الصوتية للنبر أن النبر يرتبط بشكل كبير بموسط المدة والمطال، وتميزت قواعد إسناد النبر بثلاث درجات: النبر الأولي، والثانوي، والمعدوم.
-
ما هي التحديات التي تواجه نظام تركيب الكلام المطور في هذه الأطروحة؟
من التحديات التي تواجه النظام عدم تضمين مشكل آلي للنصوص غير المشكولة، والحاجة إلى تحسين التنغيم على مستوى الجمل بشكل آلي، بالإضافة إلى إمكانية دمج النظام مع تقنيات تعلم الآلة الحديثة لتحسين دقة النتائج وزيادة طبيعية الكلام المركب.
References used
A. A. Almisreb A. F. Abidin, N. M. Tahir An acoustic investigation of Arabic vowels pronounced by Malay speakers [Article] // Journal of King Saud University – Computer and Information Sciences . - [s.l.] : Conference: 2016 IEEE 12th International Colloquium on Signal Processing & Its Applications (CSPA), 2016. - 28, 148–156
A. Al.Shalaby O. Dakkak, N.Alawa Automatic Prosody Generation for Arabic Text To Speech Systems [Article] // Damascus University Journal for the Basic Sciences. - 2013. - Vol. 29 - No. 1
A. Almisreb A. F. Abidin, N. Md .Tahir An acoustic investigation of Arabic vowels pronounced by Malay speakers [Article] // Journal of King Saud University - Computer and Information Sciences. - 2016. - Vol.(28) Issue(2), Pages 148-156
The main purpose of the present research is to support Arabic Text- to - Speech synthesizers, with
natural prosody, based on linguistic analysis of texts to synthesize, and automatic prosody generation,
using rules which are deduced from recorded s
This paper presents ArOntoLearn, a Framework for Arabic Ontology learning from textual resources.
Supporting Arabic language and using domain knowledge in the learning process are the main features of
our framework. Besides it represents the learne
Sentiment classification and sarcasm detection attract a lot of attention by the NLP research community. However, solving these two problems in Arabic and on the basis of social network data (i.e., Twitter) is still of lower interest. In this paper w
The study aimed at investigating linguistic performances of the teachers of Arabic
language and their relation to their attitudes towards teaching. The sample of the study
consisted of 40 Arabic teachers from the public schools in the Northeastern
An expert system was developed to consider words' grammar case in Arabic phrases without diacritics. First, the system gets words' morphology and tags using Microsoft tool (ATK), then it depends on Arabic grammar to get words' grammar case in nominal