تشكل قواعد البيانات الصوتية حجر الأساس في بناء نظم النطق الآلي و التعرف الآلي على الكلام و على المتكلم باختلاف اللغات و اللهجات، و تكون عناصر قاعدة البيانات الصوتية عادةً ملفات صوتية سبق أن سجلت لأصوات أشخاص باللغة أو اللهجة المطلوبة، و كلما ذخرت قاعدة البيانات الصوتية بعناصر شاملة كلما أسهم ذلك في إنتاج أنظمة تخاطب مع الآلة ذات أداء متميز.
و نظراً لعدم توفر قاعدة بيانات صوتية للهجات السورية؛ تمَّ في البحث بإنشاء قاعدة بيانات للصوتيات السورية، ضمت ستة عشر متطوع و متطوعة من مناطق سورية مختلفة اللهجة سُجلت أصواتهم في ظروف تسجيل مختلفة؛ و ذلك لدراسة تأثير تنوع اللهجات و اختلاف الجنس و ظروف التسجيل على مساحات المضلعات الصوتية.
استثمر هذا البحث قاعدة البيانات الصوتية المُنجزة في مجال توليد و تحليل مضلعات الصوتيات السورية، و بالتالي تمَّ الحصول 64 مضلع صوتي تعود إلى 16 متحدث،حيث أن المضلع الصوتي هو مضلع هندسي رؤوسه تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات ((Formants، و مساحة المضلع الصوتي الناتج تمثل مساحة المجال الصوتي.
Speech databases form the main foundation in the construction of automatic
utterance, speaker recognition and speech recognition systems in different languages and
dialects. The elements of the speech database are audio files recorded for people's voices in
the required language or dialect. The more the speech database is enriched with
comprehensive elements the more it contributes to produce systems that communicate with
the excellent performed machine. According to the lack of speech databases for the Syrian
dialects, the research did one. The created database contained sixteen voluntaries from
different Syrian dialects. Voluntaries' voices were recorded in different recording
conditions that is for studying the effect of variety of dialects, gender and the conditions of
recording on the vowel polygons. This research invested the created speech database in the
field of generating and analyzing of vowel polygons, as the vowel polygon is a geometric
polygon where its vertices represent the values of formant frequencies, and the area of the
polygon represents the output acoustic space.
Artificial intelligence review:
Research summary
تتناول هذه الدراسة إنشاء قاعدة بيانات صوتية للهجات السورية وتحليل المضلعات الصوتية الناتجة عنها. تم تسجيل أصوات 16 متحدثًا من مختلف المناطق السورية بلهجات متنوعة وظروف تسجيل مختلفة. يهدف البحث إلى دراسة تأثير تنوع اللهجات والجنس وظروف التسجيل على مساحات المضلعات الصوتية. تم استخدام خوارزمية MFCC لاستخلاص ترددات النغمات الصوتية وتحليلها. النتائج أظهرت تباينًا في مساحات المضلعات الصوتية بين التسجيل الاحترافي والتسجيل العادي، وكذلك بين الذكور والإناث. توصي الدراسة بتوسيع قاعدة البيانات لتشمل فئات عمرية مختلفة ودراسة تأثير العمر على المجال الصوتي.
Critical review
دراسة نقدية: تُعتبر هذه الدراسة خطوة مهمة نحو فهم الخصائص الصوتية للهجات السورية، إلا أنها تفتقر إلى شمولية أكبر من حيث عدد المتحدثين وتنوع الأعمار. كما أن الاعتماد على تسجيلات في ظروف مختلفة قد يؤثر على دقة النتائج. يُفضل أن يتم استخدام تقنيات تسجيل موحدة لضمان تجانس البيانات. بالإضافة إلى ذلك، يمكن أن تكون الدراسة أكثر فائدة إذا تضمنت تحليلًا أعمق لتأثير العوامل الاجتماعية والثقافية على اللهجات.
Questions related to the research
-
ما الهدف الرئيسي من إنشاء قاعدة البيانات الصوتية للهجات السورية؟
الهدف الرئيسي هو دراسة تأثير تنوع اللهجات والجنس وظروف التسجيل على مساحات المضلعات الصوتية وتطوير نظم حاسوبية للتعرف على الكلام والنطق الآلي للهجات السورية.
-
ما هي خوارزمية MFCC المستخدمة في الدراسة؟
خوارزمية MFCC (Mel Frequency Cepstral Coefficients) هي خوارزمية تُستخدم لاستخلاص السمات الصوتية من الإشارات الصوتية، وهي تُستخدم بشكل واسع في تحليل ومعالجة الصوتيات.
-
ما هي النتائج الرئيسية التي توصلت إليها الدراسة؟
النتائج أظهرت تباينًا في مساحات المضلعات الصوتية بين التسجيل الاحترافي والتسجيل العادي، وكذلك بين الذكور والإناث، حيث كانت مساحات المضلعات الصوتية الناتجة عن التسجيل العادي أكبر من تلك الناتجة عن التسجيل الاحترافي.
-
ما هي التوصيات التي قدمتها الدراسة لتحسين قاعدة البيانات الصوتية؟
توصي الدراسة بتوسيع قاعدة البيانات الصوتية لتشمل تسجيلات لأشخاص من فئات عمرية مختلفة ودراسة تأثير العمر على المجال الصوتي، وكذلك بناء قاعدة بيانات للأصوات الهاتفية للمتحدثين السوريين.
References used
STANEK, M., SIGMUND, M. Speaker Dependent Changes in Formants Based on Normalization of Vowel Triangle. In Proc. 23rd International Conference RADIOELEKTRONIKA. Pardubice. Czech Republic, 2013, pp. 337-341
ALGHAMDI, M. Analysis, Synthesis and Perception of Voicing in Arabic. Al- ToubahBookshop, Riyadh. 2004, P. 50
KENSTOWICZ, M. Parametric variation and accent in the Arabic dialects, 1983, CLS19: 205-213
In this research, a new comparison criterion was proposed to study properties of the
audio signal for each of the varieties of smokers and non-smoking persons. For this
purpose, a database for smokers has been created. The smoker database contains
The importance of research lies in the need to keep pace with the technological development of computer systems and technologies
Modern methods, especially geographic information systems, in collecting, storing, analyzing and exiting
Spatial inform
This paper presents a method integrating database with Jgroup
based on Hibernate, which is one of Object Relational Mapping
tools. We compare between the performance of Jgroup integrated
with Hibernate and the performance of RMI integrated with
Hibernate. The results show that Jgroup/Hibernate outperforms
RMI/Hibernate when the number of clients increases.
The research aims to study how to add new components to Multisim database. Or
how to model a component using the programing language C++ , to use this new
component later in designing and making electronic circuits and devices.
Multisim has built-
Most of the contracting companies suffer from poor coordination between the projects that they implement at the same time, and in Shauria, the situation is getting worse due to the absence of the application of modern methodologies in project managem