Do you want to publish a course? Click here

Isolated Word Recognition

التعرف على الكلمات المعزولة

2185   0   186   0 ( 0 )
 Publication date 2016
and research's language is العربية
 Created by Zulfiqar Murhej




Ask ChatGPT about the research

No English abstract


Artificial intelligence review:
Research summary
يتناول هذا البحث بناء نظام للتعرف على الكلمات المعزولة باستخدام نماذج ماركوف المخفية (HMM) وتقنية Mel Frequency Cepstral Coefficients (MFCC). يهدف النظام إلى مساعدة مرضى الشلل الرباعي في التفاعل مع الحاسب من خلال التعرف على الأرقام الإنجليزية. تم جمع 2000 عينة صوتية من 20 شخصًا، وتمت معالجة هذه البيانات للتخلص من الضجيج باستخدام تقنية MFCC لاستخراج 12 سمة لكل إشارة. ثم تم فهرسة هذه السمات باستخدام التكميم الشعاعي للحصول على فهرس مكون من 130 عنقودًا، والذي يستخدم كدخل لنموذج ماركوف المخفي الذي تم تدريبه على عينات التدريب. حقق النظام دقة تصل إلى 86%. يشمل البحث دراسة تفصيلية لمراحل التعرف على الكلام، بدءًا من التسجيل ومعالجة الإشارة، مرورًا باستخراج السمات، وصولًا إلى التكميم الشعاعي وتوليد الفهرس، وأخيرًا استخدام نماذج ماركوف المخفية في التعرف على الكلمات.
Critical review
دراسة نقدية: على الرغم من أن البحث يقدم نظامًا فعالًا للتعرف على الكلمات المعزولة باستخدام نماذج ماركوف المخفية وتقنية MFCC، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، يمكن زيادة عدد عينات التدريب وتنويعها لتغطية أكبر شريحة ممكنة من الأصوات البشرية، مما يزيد من دقة النظام. ثانيًا، يمكن دمج تقنيات أخرى لاستخراج السمات مثل DTW أو الشبكات العصبية لتحسين نتائج التدريب. ثالثًا، يمكن تحسين معالجة الإشارة بشكل أكبر للتخلص من الضجيج بشكل أفضل. وأخيرًا، يمكن دراسة تأثير استخدام نماذج ماركوف المخفية في لغات أخرى غير الإنجليزية لتوسيع نطاق التطبيق.
Questions related to the research
  1. ما هو الهدف الرئيسي من بناء نظام التعرف على الكلمات المعزولة في هذا البحث؟

    الهدف الرئيسي هو مساعدة مرضى الشلل الرباعي في التفاعل مع الحاسب من خلال التعرف على الأرقام الإنجليزية.

  2. ما هي التقنية المستخدمة لاستخراج السمات من الإشارات الصوتية؟

    تم استخدام تقنية Mel Frequency Cepstral Coefficients (MFCC) لاستخراج السمات من الإشارات الصوتية.

  3. ما هي دقة النظام الذي تم تحقيقها في هذا البحث؟

    حقق النظام دقة تصل إلى 86%.

  4. ما هي الخطوة التالية بعد استخراج السمات في عملية التعرف على الكلمات المعزولة؟

    بعد استخراج السمات، يتم فهرسة هذه السمات باستخدام التكميم الشعاعي للحصول على فهرس مكون من 130 عنقودًا، والذي يستخدم كدخل لنموذج ماركوف المخفي.


References used
Fundamentals of Speech Recognition
rate research

Read More

This article describes a system to predict the complexity of words for the Lexical Complexity Prediction (LCP) shared task hosted at SemEval 2021 (Task 1) with a new annotated English dataset with a Likert scale. Located in the Lexical Semantics trac k, the task consisted of predicting the complexity value of the words in context. A machine learning approach was carried out based on the frequency of the words and several characteristics added at word level. Over these features, a supervised random forest regression algorithm was trained. Several runs were performed with different values to observe the performance of the algorithm. For the evaluation, our best results reported a M.A.E score of 0.07347, M.S.E. of 0.00938, and R.M.S.E. of 0.096871. Our experiments showed that, with a greater number of characteristics, the precision of the classification increases.
To evaluate the symptoms, causes, methods of management and efficacy of this methods of isolated sphenoid sinus disease. Isolated sphenoid sinus disease is uncommon, but it may be critical and a cause of important ocular and neurological complications.
Modern natural language understanding models depend on pretrained subword embeddings, but applications may need to reason about words that were never or rarely seen during pretraining. We show that examples that depend critically on a rarer word are more challenging for natural language inference models. Then we explore how a model could learn to use definitions, provided in natural text, to overcome this handicap. Our model's understanding of a definition is usually weaker than a well-modeled word embedding, but it recovers most of the performance gap from using a completely untrained word.
In this work, our goal is recognizing human action from video data. First we propose an overview about Human Action Recognition, includes the famous methods and previous algorithms, then we propose an algorithm and its implementation using MATLAB.
Abstract We take a step towards addressing the under- representation of the African continent in NLP research by bringing together different stakeholders to create the first large, publicly available, high-quality dataset for named entity recognition (NER) in ten African languages. We detail the characteristics of these languages to help researchers and practitioners better understand the challenges they pose for NER tasks. We analyze our datasets and conduct an extensive empirical evaluation of state- of-the-art methods across both supervised and transfer learning settings. Finally, we release the data, code, and models to inspire future research on African NLP.1

suggested questions

comments
Fetching comments Fetching comments
Sign in to be able to follow your search criteria
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا