تمَّ في هذا البحث اقتراح معيار لدراسة خصائص إشارة الصوت لكل من صنفي المدخنين و غير المدخنين، إذ تمَّ بناء قاعدة بيانات تضم ملفات صوتية تعود إلى 12 شخص سوري (6 أشخاص مدخنين و 6 أشخاص غير مدخنين)، تتراوح أعمار جميع الأشخاص بين 35 و 45 عام، جميعهم ذكور و يعيشون في مناطق ريفية متجاورة.
استغرقت عملية تسجيل الملفات الصوتية ثلاث ساعات، حيث لفظ جميع المتحدثين جملة / أَنَاْ أُحِبُّ سُوْرِيْة /، و هي جملة غنية صوتياً تشمل جميع الأحرف الصوتية الطويلة (الألف و الواو و الياء) و الحروف الصوتية القصيرة (الفتحة و الضمة و الكسرة).
اعتماداً على التسجيلات الناتجة تمَّ توليد المثلثات الصوتية الطويلة و القصيرة، و هي مثلثات هندسية رؤوسها تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات (Formants)، حيث تمَّ توليد المثلثات الصوتية الطويلة (AAIIUU) في 10 مستويات، و كذلك المثلثات الصوتية القصيرة (AIU) في 10 مستويات؛ و بذلك نتج 20 مثلث صوتي لكل شخص. تمَّ في كل مستوي حساب المسافة بين جميع مراكز المثلثات الصوتية و اختيار المسافة الأدنى (d)، فيكون المستوي ذو القيمة الأعظمية للمسافة (d) هو المستوي الممثل للمثلث الصوتي الأنسب لتمييز المدخنين من غير المدخنين، و قد تحقق ذلك بالنسبة للمثلثين AIU35 و .AAIIUU45.
In this research, a new comparison criterion was proposed to study properties of the
audio signal for each of the varieties of smokers and non-smoking persons. For this
purpose, a database for smokers has been created. The smoker database contains 12 Syrian
native speakers, six of them were smokers and the others were non-smokers. The smokers
had been smoking for more than 10 years. All speakers were men and their ages ranging
between 35 and 42 years old. They live in rural towns and speak the same dialect.
Syrian vowels can be classified into long vowels and short ones. The long vowels are
/AA/, /UU/, /II/ pronounced as ([ ي, و, ا ]) and the short vowels are /A/, /U/, /I/ pronounced
as ([ كسرة, ضمة, فتحة ]). In this study, the Speakers have to pronounce the following sentence
/I love Syria/ pronounced as ([ أَنَاْ أَحَبُّ سُوْرِيْة ]), and it was spoken during three hours. This
sentence is rich with vowels.
For each speaker, a long vowel triangle in ten planes and a short vowel triangle in ten
planes as well were generated and analyzed. A new criterion was suggested to determine
the most suitable vowel triangle for smoker distinction. This criterion depends on
calculating the different distances among all centers of vowel triangles in each plane and
determining the minimal distance called d. For each plane, the most suitable vowel triangle
had been set as AIU35 short vowel triangle and AAIIUU45 long vowel triangle.
Artificial intelligence review:
Research summary
تقدم هذه الدراسة معيارًا جديدًا لتمييز المدخنين عن غير المدخنين بناءً على تحليل المثلثات الصوتية. تم إنشاء قاعدة بيانات صوتية تحتوي على تسجيلات لـ 12 شخصًا سوريًا (6 مدخنين و6 غير مدخنين) تتراوح أعمارهم بين 35 و45 عامًا، جميعهم ذكور ويعيشون في مناطق ريفية متجاورة. تم تسجيل جملة 'أنا أحب سوريا' من قبل جميع المتحدثين، وهي جملة غنية صوتيًا تشمل جميع الأحرف الصوتية الطويلة والقصيرة. تم تحليل التسجيلات باستخدام خوارزمية MFCC لتوليد مثلثات صوتية طويلة وقصيرة في 10 مستويات لكل منها، وتم حساب المسافات بين مراكز هذه المثلثات لاختيار المستوى الأنسب للتمييز بين المدخنين وغير المدخنين. أظهرت النتائج أن المثلثات الصوتية القصيرة AIU35 والطويلة AAIIUU45 هي الأنسب لتمييز المدخنين عن غير المدخنين.
Critical review
تعتبر هذه الدراسة خطوة مهمة نحو تطوير تقنيات تمييز المدخنين عن غير المدخنين باستخدام تحليل الصوت. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، حجم العينة صغير جدًا (12 شخصًا فقط)، مما قد يؤثر على دقة النتائج. ثانياً، جميع المشاركين كانوا من الذكور ومن نفس المنطقة الجغرافية، مما قد يحد من تعميم النتائج على مجموعات أخرى. ثالثاً، لم يتم التطرق إلى تأثير العوامل الأخرى مثل الحالة الصحية العامة أو البيئة المحيطة على نتائج التحليل الصوتي. يمكن أن تكون هذه العوامل مؤثرة ويجب أخذها في الاعتبار في الدراسات المستقبلية.
Questions related to the research
-
ما هو الهدف الرئيسي من هذه الدراسة؟
الهدف الرئيسي هو إيجاد معيار لتمييز المدخنين عن غير المدخنين باستخدام تحليل المثلثات الصوتية.
-
ما هي الجملة التي تم تسجيلها من قبل المشاركين في الدراسة؟
الجملة التي تم تسجيلها هي 'أنا أحب سوريا'.
-
ما هي الخوارزمية المستخدمة في تحليل الصوت في هذه الدراسة؟
الخوارزمية المستخدمة هي خوارزمية MFCC (معاملات تردد الميل).
-
ما هي المثلثات الصوتية التي تم تحديدها كأنسب لتمييز المدخنين عن غير المدخنين؟
المثلثات الصوتية القصيرة AIU35 والطويلة AAIIUU45 هي الأنسب لتمييز المدخنين عن غير المدخنين.
References used
LOUISE D, ANGELIKA B ,Voice Parameter Changes in Smokers During Abstinence from Cigarate Smoking, 2011, Proceedings of the Icphs xvii, p588-590
GRAY G, HARVEY R, The Effects of Smoking on the Speaking Fundamental Frequency of Adult Women, Journal of Psycholinguistic Research , Issn 1573-6555, vol. 3 (3. 1974), p. 225-231
AMPARO G, Early Effects of Smoking on the Voice: Amultidimensional Study, 2004, International Medical Journal of Experimental and Clinical Research, 2004, p649-56