في هذا المشروع نقوم بدراسة المويجات و تحويل المويجة، و بيان إمكانية توظيفه في معالجة و تحليل الإشارة
الكلامية و ذلك بهدف تحسينها و إزالة الضجيج منها، حيث سنطرح بعض الخوارزميات التي تعتمد على
تحويل المويجة و آلية تطبيقها من أجل التخلص من الضجيج في الإشارة الكلامية، و نقارن نتائج تطبيق هذه
الخوارزميات مع بعض الخوارزميات التقليدية التي تستخدم في تحسين الإشارة الكلامية.
In this project we study wavelet and wavelet transform, and the possibility of its employment in the processing and analysis of the speech signal in order to enhance the signal and remove noise of it. We will present different algorithms that depend on the wavelet transform and the mechanism to apply them in order to get rid of noise in the speech, and compare the results of the application of these algorithms with some traditional algorithms that are used to enhance the speech.
Artificial intelligence review:
Research summary
يتناول هذا البحث مشكلة تحسين الكلام والتخلص من الضجيج باستخدام تحويل المويجات. يهدف البحث إلى دراسة تحويل المويجات وتطبيقاته في معالجة الإشارة الكلامية، حيث يتم تقديم خوارزميات مختلفة تعتمد على تحويل المويجات مثل خوارزمية التعتيب وخوارزمية مرشح وينر في مجال المويجات. يتم مقارنة نتائج هذه الخوارزميات مع الخوارزميات التقليدية مثل الطرح الطيفي ومرشح وينر التقليدي. تتضمن الدراسة محاكاة عملية باستخدام برنامج الماتلاب لتقييم أداء الخوارزميات المختلفة وتحليل النتائج القياسية والسماعية. تظهر النتائج أن خوارزمية مرشح وينر في مجال المويجات تقدم أداءً أفضل في تحسين جودة الإشارة الكلامية والتخلص من الضجيج مقارنة بالخوارزميات الأخرى.
Critical review
دراسة نقدية: يعتبر هذا البحث شاملاً ومفصلاً في دراسة وتحليل تحويل المويجات وتطبيقاته في تحسين الإشارة الكلامية. ومع ذلك، يمكن ملاحظة بعض النقاط التي قد تحتاج إلى تحسين. أولاً، قد يكون من المفيد تقديم مزيد من التفاصيل حول كيفية اختيار العتبات المثلى في خوارزمية التعتيب، حيث أن هذا العنصر يعتبر حاسماً في أداء الخوارزمية. ثانياً، يمكن تحسين الجزء المتعلق بالنتائج السماعية من خلال استخدام مجموعة أكبر من المستمعين لضمان دقة أكبر في التقييم. ثالثاً، يمكن أن يكون هناك مزيد من التركيز على تطبيقات عملية أخرى لتحويل المويجات في مجالات مختلفة من معالجة الإشارة الصوتية.
Questions related to the research
-
ما هي الخوارزميات التي تم استخدامها في البحث لتحسين الإشارة الكلامية؟
تم استخدام خوارزمية التعتيب وخوارزمية مرشح وينر في مجال المويجات، بالإضافة إلى الخوارزميات التقليدية مثل الطرح الطيفي ومرشح وينر التقليدي.
-
ما هي الأدوات التي تم استخدامها في محاكاة الخوارزميات؟
تم استخدام برنامج الماتلاب في محاكاة الخوارزميات المختلفة لتحسين الإشارة الكلامية والتخلص من الضجيج.
-
ما هي النتائج التي توصل إليها البحث فيما يتعلق بأداء الخوارزميات المختلفة؟
أظهرت النتائج أن خوارزمية مرشح وينر في مجال المويجات تقدم أداءً أفضل في تحسين جودة الإشارة الكلامية والتخلص من الضجيج مقارنة بالخوارزميات الأخرى.
-
ما هي النقاط التي يمكن تحسينها في البحث؟
يمكن تحسين البحث من خلال تقديم مزيد من التفاصيل حول كيفية اختيار العتبات المثلى في خوارزمية التعتيب، وزيادة عدد المستمعين في التقييم السماعي، والتركيز على تطبيقات عملية أخرى لتحويل المويجات في مجالات مختلفة من معالجة الإشارة الصوتية.
References used
Stark, Henry; Woods, John W, "Probability, Random Processes, and Estimation Theory for Engineers". Prentice-Hall, Inc. ISBN 0-13-711706-X. 1986
Savita Hooda and Smriti Aggarwal,"Review of MMSE Estimator for Speech Enhancement", ijecs, Vol. 4 - Issue 5 (May - 2015)
Jonathan Le Roux, John R. Hershey , "INDIRECT MODEL-BASED SPEECH ENHANCEMENT", IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Paper: SP-L3.5, March 2012 (ICASSP, TR2012-016)
The masking-based speech enhancement method pursues a multiplicative mask that applies to the spectrogram of input noise-corrupted utterance, and a deep neural network (DNN) is often used to learn the mask. In particular, the features commonly used f
Weather forecasting (especially rainfall) is one of the most important and challenging
operational tasks carried out by meteorological services all over the world. Itis furthermore
a complicated procedure that requires multiple specialized fields o
This memo describes NTR-TSU submission for SIGTYP 2021 Shared Task on predicting language IDs from speech. Spoken Language Identification (LID) is an important step in a multilingual Automated Speech Recognition (ASR) system pipeline. For many low-re
Bias mitigation approaches reduce models' dependence on sensitive features of data, such as social group tokens (SGTs), resulting in equal predictions across the sensitive features. In hate speech detection, however, equalizing model predictions may
This paper aims to describe the approach we used to detect hope speech in the HopeEDI dataset. We experimented with two approaches. In the first approach, we used contextual embeddings to train classifiers using logistic regression, random forest, SV