ترغب بنشر مسار تعليمي؟ اضغط هنا

التعرف على الكلمات المعزولة

Isolated Word Recognition

2184   0   186   0 ( 0 )
 تاريخ النشر 2016
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Zulfiqar Murhej




اسأل ChatGPT حول البحث

الغاية من هذا البحث بناء نظام لتصنيف نطق الأرقام الانكليزية وذلك بالاعتماد على نماذج ماركوف المخفية في التصنيف وذلك بالاعتماد على طيف الإشارة في استخراج سمات الإشارات


ملخص البحث
يتناول هذا البحث بناء نظام للتعرف على الكلمات المعزولة باستخدام نماذج ماركوف المخفية (HMM) وتقنية Mel Frequency Cepstral Coefficients (MFCC). يهدف النظام إلى مساعدة مرضى الشلل الرباعي في التفاعل مع الحاسب من خلال التعرف على الأرقام الإنجليزية. تم جمع 2000 عينة صوتية من 20 شخصًا، وتمت معالجة هذه البيانات للتخلص من الضجيج باستخدام تقنية MFCC لاستخراج 12 سمة لكل إشارة. ثم تم فهرسة هذه السمات باستخدام التكميم الشعاعي للحصول على فهرس مكون من 130 عنقودًا، والذي يستخدم كدخل لنموذج ماركوف المخفي الذي تم تدريبه على عينات التدريب. حقق النظام دقة تصل إلى 86%. يشمل البحث دراسة تفصيلية لمراحل التعرف على الكلام، بدءًا من التسجيل ومعالجة الإشارة، مرورًا باستخراج السمات، وصولًا إلى التكميم الشعاعي وتوليد الفهرس، وأخيرًا استخدام نماذج ماركوف المخفية في التعرف على الكلمات.
قراءة نقدية
دراسة نقدية: على الرغم من أن البحث يقدم نظامًا فعالًا للتعرف على الكلمات المعزولة باستخدام نماذج ماركوف المخفية وتقنية MFCC، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، يمكن زيادة عدد عينات التدريب وتنويعها لتغطية أكبر شريحة ممكنة من الأصوات البشرية، مما يزيد من دقة النظام. ثانيًا، يمكن دمج تقنيات أخرى لاستخراج السمات مثل DTW أو الشبكات العصبية لتحسين نتائج التدريب. ثالثًا، يمكن تحسين معالجة الإشارة بشكل أكبر للتخلص من الضجيج بشكل أفضل. وأخيرًا، يمكن دراسة تأثير استخدام نماذج ماركوف المخفية في لغات أخرى غير الإنجليزية لتوسيع نطاق التطبيق.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من بناء نظام التعرف على الكلمات المعزولة في هذا البحث؟

    الهدف الرئيسي هو مساعدة مرضى الشلل الرباعي في التفاعل مع الحاسب من خلال التعرف على الأرقام الإنجليزية.

  2. ما هي التقنية المستخدمة لاستخراج السمات من الإشارات الصوتية؟

    تم استخدام تقنية Mel Frequency Cepstral Coefficients (MFCC) لاستخراج السمات من الإشارات الصوتية.

  3. ما هي دقة النظام الذي تم تحقيقها في هذا البحث؟

    حقق النظام دقة تصل إلى 86%.

  4. ما هي الخطوة التالية بعد استخراج السمات في عملية التعرف على الكلمات المعزولة؟

    بعد استخراج السمات، يتم فهرسة هذه السمات باستخدام التكميم الشعاعي للحصول على فهرس مكون من 130 عنقودًا، والذي يستخدم كدخل لنموذج ماركوف المخفي.


المراجع المستخدمة
Fundamentals of Speech Recognition
قيم البحث

اقرأ أيضاً

توضح هذه المقالة نظاما للتنبؤ بمهمة تقوية التعقيد المعجمية (LCP) التي تم استضافتها في Semeval 2021 (المهمة 1) مع مجموعة بيانات جديدة مشروحة مع مقياس Likert.يقع المهمة في مسار الدلالات المعجمية، وتألفت المهمة من التنبؤ بقيمة تعقيد الكلمات في السياق.تم تنفيذ نهج لتعلم الآلات بناء على تواتر الكلمات والعديد من الخصائص المضافة على مستوى Word.على هذه الميزات، تم تدريب خوارزمية الانحدار الغابات العشوائية الخاضعة للإشراف.تم إجراء عدة أشواط بقيم مختلفة لمراقبة أداء الخوارزمية.للتقييم، أبلغت أفضل النتائج الخاصة بنا عن درجة M.A.E 0.07347، M.S.E.من 0.00938، و R.M.S.E.من 0.096871.أظهرت تجاربنا أنه مع عدد أكبر من الخصائص، فإن دقة التصنيف تزداد.
هدف هذا البحث لدراسة حالات الإصابة المعزولة بالجيب الوتدي من حيث الأعراض، و أسباب الإصابة، و طريقة تدبيرها، و فعالية هذه الطريقة. إن آفات الجيب الوتدي المعزولة هي آفات غير شائعة؛ إلا أنها قد تدل على آفات خطيرة و قد تكون السبب لاختلاطات عصبية و عينية مهمة.
تعتمد نماذج فهم اللغة الطبيعية الحديثة على أشرطة الكلمات الفرعية مسبقا، ولكن قد تحتاج التطبيقات إلى سبب الكلمات التي لم تكن أبدا أو نادرا ما ينظر إليها أثناء الاحتجاج.نظير على أن الأمثلة التي تعتمد بشكل نقدي على كلمة ندرة هي أكثر تحديا لنماذج الاستدل ال اللغوية الطبيعية.ثم نستكشف كيف يمكن أن يتعلم نموذج التعريفات، المقدمة في النص الطبيعي، للتغلب على هذا الإعاقة.عادة ما يكون فهم النموذج الخاص بتعريف ضعيفا أكثر أضعف من تضمين كلمة مصممة بشكل جيد، لكنه يستعيد معظم فجوة الأداء من استخدام كلمة غير مدربة تماما.
نهدف في هذه الأطروحة إلى التعرف على النشاط البشري من مقطع فيديو. نبدأ بدراسة مرجعية تشمل الطرق والخوارزميات المتّبعة في هذا المجال، وعرض لقواعد البيانات العالمية والطرق المتبعة في الاختبار، ثم ننتقل إلى تصميم نظام للتعرف على النشاط البشري وتنفيذه في بيئة MATLAB.
الملخص نتخذ خطوة نحو معالجة تمثيل القارة الأفريقية في أبحاث NLP من خلال جلب مختلف أصحاب المصلحة من أصحاب المصلحة في إنشاء بيانات كبيرة متاحة للجمهور وعالية الجودة للتعرف على الكيان المسمى (NER) في عشرة لغات أفريقية.إننا نقوم بالتفصيل خصائص هذه اللغات لمساعدة الباحثين والممارسين على فهم التحديات التي يفرضونها على مهام NER.نقوم بتحليل مجموعات البيانات لدينا وإجراء تقييم تجريبي واسع النطاق للطرق الحكومية في جميع إعدادات التعلم الإشراف والنقل.أخيرا، نطلق سراح البيانات والرمز والنماذج لإلهام البحوث المستقبلية على الأفريقية NLP.1

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا