ترغب بنشر مسار تعليمي؟ اضغط هنا

دراسة تأثير معاملات خوارزمية الطرح الطيفي المعدَلة و طول النافذة الزمنية في تحسين الإشارات الصوتية

Studying the effect of modified spectral subtraction algorithm parameters and time window length in speech signals enhancement

1338   0   24   0 ( 0 )
 تاريخ النشر 2015
  مجال البحث هندسة اتصالات
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن إلغاء الضجيج من الكلام الملوث هو حقل هندسي يدرس التقنيات المستخدمة لاستعادة الإشارة الأصلية من الإشارة الملوثة بأنواع مختلفة من الضجيج مثل الضجيج عريض الحزمة و ضيق الحزمة و أنواع أخرى موجودة بالبيئة و تعتبر تقنية الطرح الطيفي الأبرز في هذا المجال. في هذا البحث سوف نناقش تأثير معاملات خوارزمية الطرح الطيفي المعدلة و طول النافذة الزمنية في تحسين الكلام الملوث بالضجيج عريض الحزمة. تمَ دراسة و تحديد قيم المعاملات المثالية و طول النافذة المثالي عند قيم مختلفة لنسبة الإشارة إلى الضجيج SNR للإشارة الملوثة و هي و تمَ مناقشة 18 حالة عند كل قيمة. أجريت المحاكاة باستخدام برنامج الماتلاب (matlab) و تمت مقارنة النتائج سماعياً و بالاعتماد على تحسين قيمة SNR لكل حالة.


ملخص البحث
تتناول هذه الورقة البحثية دراسة تأثير معاملات خوارزمية الطرح الطيفي المعدلة وطول النافذة الزمنية في تحسين الإشارات الصوتية الملوثة بالضجيج عريض الحزمة. تهدف الدراسة إلى تحديد القيم المثلى لهذه المعاملات عند نسب مختلفة للإشارة إلى الضجيج (SNR) وهي 0، 5، 10، 15 ديسيبل. تم إجراء المحاكاة باستخدام برنامج الماتلاب، وتمت مقارنة النتائج سماعياً وبالاعتماد على تحسين قيمة SNR. تتضمن الدراسة تصميم خوارزمية الطرح الطيفي المعدلة، إضافة ضجيج عريض الحزمة إلى إشارة صوتية مسجلة واضحة، واختبار عدة قيم لمعاملات الخوارزمية وطول النافذة الزمنية. أظهرت النتائج أن الخوارزمية تقدم أداءً جيداً في تخفيض الضجيج الخلفي، مع وجود بعض التشويه الطفيف في الكلام المحسن. توصي الدراسة بإعادة البحث باستخدام نوافذ زمنية أخرى وتحسين دقة الكاشف الفعال للصوت.
قراءة نقدية
تعتبر هذه الدراسة خطوة مهمة في مجال تحسين الإشارات الصوتية الملوثة بالضجيج، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، كان من الأفضل توسيع نطاق القيم المدروسة لمعاملات الخوارزمية وطول النافذة الزمنية لتشمل نطاقات أوسع. ثانياً، يمكن تحسين دقة الكاشف الفعال للصوت المستخدم في الخوارزمية، مما قد يؤدي إلى تحسين الأداء بشكل أكبر. ثالثاً، لم تتناول الدراسة تأثير أنواع أخرى من الضجيج غير عريض الحزمة، مما يحد من تطبيقات الخوارزمية في بيئات متنوعة. أخيراً، كان من الممكن تضمين معايير أخرى غير SNR لمقارنة الأداء، مثل مقارنة النتائج سماعياً أو رسم المخططات الطيفية.
أسئلة حول البحث
  1. ما هي الخوارزمية المستخدمة في تحسين الإشارات الصوتية الملوثة بالضجيج في هذه الدراسة؟

    الخوارزمية المستخدمة هي خوارزمية الطرح الطيفي المعدلة.

  2. ما هي القيم المدروسة لنسبة الإشارة إلى الضجيج (SNR) في هذه الدراسة؟

    القيم المدروسة لنسبة الإشارة إلى الضجيج هي 0، 5، 10، 15 ديسيبل.

  3. ما هو البرنامج المستخدم في محاكاة الخوارزمية؟

    البرنامج المستخدم في المحاكاة هو برنامج الماتلاب.

  4. ما هي التوصيات التي قدمتها الدراسة لتحسين أداء الخوارزمية؟

    توصي الدراسة بإعادة البحث باستخدام نوافذ زمنية أخرى، تحسين دقة الكاشف الفعال للصوت، وتضمين معايير أخرى غير SNR لمقارنة الأداء.


المراجع المستخدمة
Kaladharan,N.Speech Enhancement by Spectral Subtraction Method.International Journal of Computer Applications (0975 – 8887) Volume 96– No.13, June 2014
Verteletskaya,E;Simak,B.Noise Reduction Based on Modified Spectral Subtraction Method.IAENG International Journal of Computer Science,38:1, IJCS_38_1_10, February ,2011
Tiwari,N;Pandey,P.Speech Enhancement Using Noise Estimation Based on Dynamic Quantile Tracking for Hearing Impaired Listeners.Proc. 21th National Conference on Communications 2015 (NCC 2015), Mumbai, Feb. 27 - Mar. 1, 2015
قيم البحث

اقرأ أيضاً

تتابع طريقة تحسين الكلام القائم على اخفاء قناع مضاعف ينطبق على الطيفية من الكلام الفاسد من ضوضاء الإدخال، وغالبا ما تستخدم شبكة عميقة العصبية (DNN) لتعلم القناع. على وجه الخصوص، يمكن أن تكون الميزات الشائعة الاستخدام للتعرف على الكلام التلقائي بمثابة مدخلات DNN لتعلم القناع حسن التصرف الذي يقلل بشكل كبير من تشويه الضوضاء للكلمات المعالجة. تقترح هذه الدراسة إعادة معالجة ميزات خطاب المدخلات لمقنعة النسبة المثالية (IRM) - DNN بواسطة Lowpass Filtering من أجل تخفيف مكونات الضوضاء. على وجه الخصوص، فإننا نوظف تحويل المويجات المنفصلة (DWT) لتحلل تسلسل ميزة الكلام الزمنية وتوسيع نطاق معاملات التفاصيل، مما يتوافق مع الجزء المرتفع من التسلسل. تكشف التجارب الأولية التي أجراها مجموعة فرعية من تيميت كوربوس أن الطريقة المقترحة يمكن أن تجعل IRM الناتجة تحقيق جودة أعلى للكلام وضوحا للإشارات الاضافة عن الضوضاء الخليفة مقارنة مع IRM الأصلي، مما يشير إلى أن تسلسل الميزات الزمنية المرشح ل Lowpass يمكن أن يتعلم متفوقة شبكة IRM لتعزيز الكلام.
في هذه الورقة، نقترح التعديل الطيفي عن طريق شحذ الأشكال وغير من خلال تقليل الميل الطيفي إلى التعرف على خطاب الأطفال حسب أنظمة التعرف على الكلام التلقائي (ASR) المطورة باستخدام خطاب البالغين.في هذا النوع من الحالة غير المعطاة، يتدهور أداء ASR بسبب عدم التطابق الصوتي واللغوي في السمات بين الأطفال والكبار.يتم استخدام الطريقة المقترحة لتحسين الوضوخي للكلام لتعزيز التعرف على خطاب الأطفال باستخدام نموذج صوتي مدرب على خطاب البالغين.في التجارب، يتم استخدام WSJCAM0 و PFSTAR كقواعد بيانات للبالغين وخطاب الأطفال، على التوالي.تتيح التقنية المقترحة تحسنا كبيرا في سياق ASR القائم على DNN-HMM.علاوة على ذلك، نحن نقوم بالتحقق من صحة متانة التقنية من خلال إظهار أنها تنفذ أيضا في ظروف ضوضاء غير متطابقة.
إن الهدف الأساسي من هذه الدراسة هو تحليل جميع حالات انصباب التامور - ما عدا التالية لجراحة القلب - التي أدخلت إلى قسم الجراحة في مشفيي الأسد و تشرين الجامعيين في الفترة الزمنية الواقعة بين 2007-2016. تمت دراسة (63) حالة انصباب تامور، (38) مريضاً و (2 5) مريضة تتراوح أعمارهم بين (67-17) عاماً. كان أهم سببين لحدوث انصبابات التامور هما القصور الكلوي بنسبة 50.7% و الخباثات بنسبة 34.9% و على رأسها سرطان الرئة الذي شكل 50% من مجموع الخباثات و نسبة 17.4% من مجموع المرضى العام. إجراء النافذة التامورية بفتح الصدر الأيسر كان هو الإجراء المفضل في مرضانا حيث بلغت نسبة إجرائه 68.2% و كانت نسبة النكس 4.6%، و كانت كمية الانصباب الناكس بسيطة جداً و لم تحتج إلى أي إجراء آخر. بزل التامور أجري عند 39.6% من المرضى و كانت نسبة النكس عالية جداً 80% لذلك ابتعدنا عن البزل كإجراء علاجي و اقتصر دوره فقط عند المرضى غير المستقرين هيموديناميكياً أو كخطوة أولى و تحضير للنافذة التامورية. تم إجراء النافذة التامورية عبر مدخل تحت الرهابة بالتخدير الموضعي عند 11.11% من المرضى، و كانت نسبة النكس 28.6%، حيث اعتمدنا هذه الطريقة فقط في الحالات التي تكون فيها حالة المريض لا تسمح بإجراء المداخل الجراحية الأخرى أو أن عمر المريض قصير و محدود. إجراء النافذة التامورية بتنظير الصدر المساعد عند 15.8% مع نسبة نكس 10% و نتائج واعدة. أمكن القيام أثناء إجراء النافذة التامورية بفتح الصدر أو التنظير ببعض الإجراءات التشخيصية و العلاجية الأخرى و ذلك عند (19) مريضاً. لعب إجراء النافذة التامورية و الإجراءات المرافقة دوراً هاماً في تشخيص الحالات مجهولة السبب بنسبة 23.8%.
يهدف علم بحوث العمليات إلى إيجاد الحل الأمثل لكثير من المشاكل و في مختلف مجالات الحياة, و من أهمها مسألة تحليل الشبكات. قدمنا في هذا البحث خوارزمية فعالة بزمن خطي( O ( n + k يتم من خلالها تنفيذ جميع أنشطة الشبكة بالكامل ضمن فترة زمنية محددة و بأقل زيادة على التكلفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا