ترغب بنشر مسار تعليمي؟ اضغط هنا

تمييز الشخص المدخن اعتماداً على تحليل مثلثات صوتية مُوَلَّدَة

Smoker Distinction Based on Analysis of Created Vowel Triangles

1031   0   14   0 ( 0 )
 تاريخ النشر 2016
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تمَّ في هذا البحث اقتراح معيار لدراسة خصائص إشارة الصوت لكل من صنفي المدخنين و غير المدخنين، إذ تمَّ بناء قاعدة بيانات تضم ملفات صوتية تعود إلى 12 شخص سوري (6 أشخاص مدخنين و 6 أشخاص غير مدخنين)، تتراوح أعمار جميع الأشخاص بين 35 و 45 عام، جميعهم ذكور و يعيشون في مناطق ريفية متجاورة. استغرقت عملية تسجيل الملفات الصوتية ثلاث ساعات، حيث لفظ جميع المتحدثين جملة / أَنَاْ أُحِبُّ سُوْرِيْة /، و هي جملة غنية صوتياً تشمل جميع الأحرف الصوتية الطويلة (الألف و الواو و الياء) و الحروف الصوتية القصيرة (الفتحة و الضمة و الكسرة). اعتماداً على التسجيلات الناتجة تمَّ توليد المثلثات الصوتية الطويلة و القصيرة، و هي مثلثات هندسية رؤوسها تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات (Formants)، حيث تمَّ توليد المثلثات الصوتية الطويلة (AAIIUU) في 10 مستويات، و كذلك المثلثات الصوتية القصيرة (AIU) في 10 مستويات؛ و بذلك نتج 20 مثلث صوتي لكل شخص. تمَّ في كل مستوي حساب المسافة بين جميع مراكز المثلثات الصوتية و اختيار المسافة الأدنى (d)، فيكون المستوي ذو القيمة الأعظمية للمسافة (d) هو المستوي الممثل للمثلث الصوتي الأنسب لتمييز المدخنين من غير المدخنين، و قد تحقق ذلك بالنسبة للمثلثين AIU35 و .AAIIUU45.


ملخص البحث
تقدم هذه الدراسة معيارًا جديدًا لتمييز المدخنين عن غير المدخنين بناءً على تحليل المثلثات الصوتية. تم إنشاء قاعدة بيانات صوتية تحتوي على تسجيلات لـ 12 شخصًا سوريًا (6 مدخنين و6 غير مدخنين) تتراوح أعمارهم بين 35 و45 عامًا، جميعهم ذكور ويعيشون في مناطق ريفية متجاورة. تم تسجيل جملة 'أنا أحب سوريا' من قبل جميع المتحدثين، وهي جملة غنية صوتيًا تشمل جميع الأحرف الصوتية الطويلة والقصيرة. تم تحليل التسجيلات باستخدام خوارزمية MFCC لتوليد مثلثات صوتية طويلة وقصيرة في 10 مستويات لكل منها، وتم حساب المسافات بين مراكز هذه المثلثات لاختيار المستوى الأنسب للتمييز بين المدخنين وغير المدخنين. أظهرت النتائج أن المثلثات الصوتية القصيرة AIU35 والطويلة AAIIUU45 هي الأنسب لتمييز المدخنين عن غير المدخنين.
قراءة نقدية
تعتبر هذه الدراسة خطوة مهمة نحو تطوير تقنيات تمييز المدخنين عن غير المدخنين باستخدام تحليل الصوت. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، حجم العينة صغير جدًا (12 شخصًا فقط)، مما قد يؤثر على دقة النتائج. ثانياً، جميع المشاركين كانوا من الذكور ومن نفس المنطقة الجغرافية، مما قد يحد من تعميم النتائج على مجموعات أخرى. ثالثاً، لم يتم التطرق إلى تأثير العوامل الأخرى مثل الحالة الصحية العامة أو البيئة المحيطة على نتائج التحليل الصوتي. يمكن أن تكون هذه العوامل مؤثرة ويجب أخذها في الاعتبار في الدراسات المستقبلية.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من هذه الدراسة؟

    الهدف الرئيسي هو إيجاد معيار لتمييز المدخنين عن غير المدخنين باستخدام تحليل المثلثات الصوتية.

  2. ما هي الجملة التي تم تسجيلها من قبل المشاركين في الدراسة؟

    الجملة التي تم تسجيلها هي 'أنا أحب سوريا'.

  3. ما هي الخوارزمية المستخدمة في تحليل الصوت في هذه الدراسة؟

    الخوارزمية المستخدمة هي خوارزمية MFCC (معاملات تردد الميل).

  4. ما هي المثلثات الصوتية التي تم تحديدها كأنسب لتمييز المدخنين عن غير المدخنين؟

    المثلثات الصوتية القصيرة AIU35 والطويلة AAIIUU45 هي الأنسب لتمييز المدخنين عن غير المدخنين.


المراجع المستخدمة
LOUISE D, ANGELIKA B ,Voice Parameter Changes in Smokers During Abstinence from Cigarate Smoking, 2011, Proceedings of the Icphs xvii, p588-590
GRAY G, HARVEY R, The Effects of Smoking on the Speaking Fundamental Frequency of Adult Women, Journal of Psycholinguistic Research , Issn 1573-6555, vol. 3 (3. 1974), p. 225-231
AMPARO G, Early Effects of Smoking on the Voice: Amultidimensional Study, 2004, International Medical Journal of Experimental and Clinical Research, 2004, p649-56
قيم البحث

اقرأ أيضاً

تشكل قواعد البيانات الصوتية حجر الأساس في بناء نظم النطق الآلي و التعرف الآلي على الكلام و على المتكلم باختلاف اللغات و اللهجات، و تكون عناصر قاعدة البيانات الصوتية عادةً ملفات صوتية سبق أن سجلت لأصوات أشخاص باللغة أو اللهجة المطلوبة، و كلما ذخرت قاع دة البيانات الصوتية بعناصر شاملة كلما أسهم ذلك في إنتاج أنظمة تخاطب مع الآلة ذات أداء متميز. و نظراً لعدم توفر قاعدة بيانات صوتية للهجات السورية؛ تمَّ في البحث بإنشاء قاعدة بيانات للصوتيات السورية، ضمت ستة عشر متطوع و متطوعة من مناطق سورية مختلفة اللهجة سُجلت أصواتهم في ظروف تسجيل مختلفة؛ و ذلك لدراسة تأثير تنوع اللهجات و اختلاف الجنس و ظروف التسجيل على مساحات المضلعات الصوتية. استثمر هذا البحث قاعدة البيانات الصوتية المُنجزة في مجال توليد و تحليل مضلعات الصوتيات السورية، و بالتالي تمَّ الحصول 64 مضلع صوتي تعود إلى 16 متحدث،حيث أن المضلع الصوتي هو مضلع هندسي رؤوسه تمثل قيم ترددات توافقيات المجرى الصوتي الممتد من الحبال الصوتية إلى الشفاه و تسمى النغمات ((Formants، و مساحة المضلع الصوتي الناتج تمثل مساحة المجال الصوتي.
تعد أنظمة استرجاع الصور الطبية اعتماداً على المحتوى من التقنيات الحديثة التي يسعى الباحثون إلى تكاملها مع أنظمة التشخيص بمساعدة الحاسوب. تقوم هذه الأنظمة أساساً بإيجاد صور في قاعدة بيانات تضم مجموعة كبيرة من الصور ذات محتوى مشابه لصورة استعلام معينة. يجري الاستعلام عن طريق استخلاص الخصائص البصرية للصورة المعينة و صياغتها في متجه خصائص تَُقارن مكوناته بمتجهات الخصائص للصور الموجودة في قاعدة البيانات و يقاس التشابه، و من ثم تسَترجع الصور التي لها محتوى مشابه لصورة الاستعلام. تقدم هذه الورقة تقييماً للوضع الراهن لأنظمة استرجاع الصور الطبية اعتماداً على المحتوى بناء على دراسة تحليلية للبحوث الحديثة المنشورة، و تخلص إلى استنتاج اتجاهات بحثية محددة في هذا المجال.
أثبتت الدراسات أن المخطط البياني للضغط العامل في أسطوانة المحرك البحري يمكن أن يعطي معلومات كثيرة ليس فقط عن الضغط بأنواعه، و إنما عن عدد كبير من المقادير المفيدة في تحسين أداء المحرك، و لهذا نحاول في هذا البحث دراسة المؤشرات التي تؤدي إلى إكمال الصو رة الفيزيائية لدورة العمل. تتمثل هذه المحاولة في استخدام موديل رياضي شامل و عميق للحصول على تلك المؤشرات و استخدامها لتكوين صورة واضحة عن دورة العمل اعتماداً على ديناميكية الإصدار الحراري في الأسطوانة، سعياً لتحسين الأداء و تحقيق استثمار فني أفضل و أكثر اقتصاديةً نصل بالنتيجة إلى جملة من الاستنتاجات و التوصيات التي تساعد عند اعتمادها على الحصول على مواصفة أكمل لدورة العمل و بدقة عالية للعملية الحسابية.
إن معظم محركات البحث المعروفة مثل جوجل هي محركات بحث نصية تطابق المفردات المدخلة فقط من قبل المستخدم وتسترجع قائمة من النتائج، يحقق نموذج محرك البحث المقترح في هذه الاطروحة حلا أفضل بشكل لا يطابق المفردات المدخلة من قبل المستخدم فقط، بل ويطابق المفر دات الأخرى التي لها علاقة مع المفردات المعطات في الأنطولوجيات الداعمة له.
تم بناء نظام استرجاع لصور الطرح الرقمي للأوعية الدموية الدماغية ثنائية الأبعاد اعتماداً على المحتوى. يقوم النظام بإيجاد صور في قاعدة بيانات لصور الطرح الرقمي للأوعية الدموية الدماغية (حالة أمهات الدم الكيسية) ذات محتوى مشابه لصورة استعلام معينة و است رجاعها. تمت عملية الاستعلام عن طريق استخلاص خصائص الشكل البصرية لأمهات الدم في صورة الاستعلام و صياغتها في متجه خصائص و مقارنة مكوناته مع متجهات خصائص الشكل لأمهات الدم في صور الطرح الرقمي للأوعية الدموية الموجودة في قاعدة البيانات. تم قياس التشابه باستخدام المسافة الاقليدية، و من ثم استرجاع الصور التي لها محتوى مشابها لصورة الاستعلام. تم حساب الدقة بإيجاد نسبة مساحة أم الدم في الصور المسترجعة الأولى إلى مساحة أم الدم في صورة الاستعلام لثمان حالات استعلام تم تنفيذها، بلغت قيمة متوسط الدقة 98%، تبين النتائج أنَّه يمكن استخدام النظام المنفذ لاسترجاع الصور اعتماداً على المحتوى لإيجاد المساحة غير المعلومة لأم الدم من قاعدة بيانات لصور أمهات الدم تكون فيها مساحة أم الدم فيها معلومة.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا