بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

تحسين استخراج السمات السمعية في الأنظمة السمعية البصرية للمتحدثين باللغة العربية

Improving the extraction of audio features In audio-visual Arabic systems

1904 2 49 0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جامعة البعث ورقة بحثية

تاريخ النشر 2017

مجال البحث الحاسبات والتحكم الآلي

والبحث باللغة العربية

تأليف جعفر محسن الخير( باحث ) - مريم محمد ساعي( باحث ) - نور سميع غضبان( باحث )

تمت اﻹضافة من قبل Shamra Editor

Features extraction MFCC نماذج ماركوف المخفية التعرف على الكلام استخراج السمات خوارزمية معاملات تردد الميل المشتقات التفاضلية مكون الطاقة Speech recognition Markov Hidden models Temporal derivatives energy component

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

تعد أنظمة التعرف السمعية البصرية التي تعتمد على صوت و حركة شفاه المتكلم من أهم أنظمة التعرف على الكلام. و قد تم تطوير العديد من التقنيات المختلفة من حيث الطرائق المستخدمة في استخراج السمات و طرائق التصنيف. يقترح البحث إنشاء نظام للتعرف على الكلمات المعزولة بالاعتماد السمات السمعية المستخرجة من فيديوهات منطوقة لكلمات باللغة العربية في بيئة خالية من الضجيج، و من ثم إضافة مكون الطاقة و المشتقات التفاضلية في مرحلة استخراج السمات لخوارزمية معاملات تردد الميل.

مراجعة الذكاء الصنعي:

قُم بترقية الحساب لمشاهدة المحتوى

ملخص البحث

تتناول هذه الدراسة تحسين استخراج السمات السمعية في أنظمة التعرف السمعية البصرية للناطقين باللغة العربية. تعتمد هذه الأنظمة على الصوت وحركة شفاه المتكلم، وقد تم تطوير العديد من التقنيات المختلفة في هذا المجال. يقترح البحث إنشاء نظام للتعرف على الكلمات المعزولة باستخدام السمات السمعية المستخرجة من فيديوهات منطوقة لكلمات باللغة العربية في بيئة خالية من الضجيج. يتم إضافة مكون الطاقة والمشتقات التفاضلية في مرحلة استخراج السمات لخوارزمية معاملات تردد الميل (MFCC). تم استخدام نماذج ماركوف المخفية (HMM) في مرحلة التصنيف. أظهرت النتائج أن إضافة السمات إلى خوارزمية MFCC زادت من أداء النظام، حيث وصلت نسبة التعرف إلى 92%. يتضمن البحث قاعدة بيانات تحتوي على 13850 مقطع فيديو ل 36 كلمة معزولة منطوقة باللغة العربية من قبل خمسين متكلم تتراوح أعمارهم بين 18 و60 عامًا. تم استخدام بيئة العمل Matlab2014a ومكتبات voicebox وsignal processing. توصل البحث إلى أن إضافة مكون الطاقة والمشتقات التفاضلية حسنت من عملية استخراج السمات السمعية وبالتالي أداء النظام ككل.

قراءة نقدية

تقدم هذه الدراسة مساهمة قيمة في تحسين أنظمة التعرف على الكلام للناطقين باللغة العربية، خاصة في بيئات خالية من الضجيج. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، تم اختبار النظام في بيئة خالية من الضجيج، مما قد لا يعكس الأداء في الظروف الواقعية حيث يكون الضجيج موجودًا. لذلك، يمكن أن تكون الدراسة أكثر شمولية إذا تم اختبار النظام في بيئات متنوعة تحتوي على مستويات مختلفة من الضجيج. ثانيًا، يمكن أن تكون النتائج أكثر قوة إذا تم مقارنة أداء النظام مع أنظمة أخرى تستخدم تقنيات مختلفة لاستخراج السمات. أخيرًا، يمكن أن تكون الدراسة أكثر تفصيلاً في شرح كيفية تأثير المشتقات التفاضلية ومكون الطاقة على تحسين أداء النظام.

أسئلة حول البحث

ما هي الخوارزمية المستخدمة في استخراج السمات في هذه الدراسة؟

تم استخدام خوارزمية معاملات تردد الميل (MFCC) في استخراج السمات في هذه الدراسة.
ما هي نسبة التعرف التي حققها النظام بعد إضافة مكون الطاقة والمشتقات التفاضلية؟

وصلت نسبة التعرف إلى 92% بعد إضافة مكون الطاقة والمشتقات التفاضلية.
ما هي بيئة العمل المستخدمة في هذه الدراسة؟

تم استخدام بيئة العمل Matlab2014a ومكتبات voicebox وsignal processing.
كم عدد العينات التي تم اختبار النظام عليها؟

تم اختبار النظام على 4155 عينة.

كلمات مفتاحية

التعرف على الكلام استخراج السمات خوارزمية معاملات تردد الميل نماذج ماركوف المخفية المشتقات التفاضلية مكون الطاقة

المراجع المستخدمة

Marius Zbancioc, Mihaela Costin :using neural networks and LPCC to improve speech recognition, International IEEE SCS Conference, Proceedings, Vol. 1, 2003 EX 720, pp. 445 – 448

Levy, C., Linares, G., Nocera, P., Bonastre, J.-F. : Reducing computational and memory cost for cellular phone embedded speech recognition system, Acoustics, Speech, and Signal Processing, 2004. Proceedings. (ICASSP '04). IEEE International Conference on (Volume:5 ) , pages( 309-12) vol.5 , Print ISBN:9-8484-7803-0

Dimitriadis, Maragos, P. Potamianos: Robust AM-FM Features for Speech Recognition, IEEE signal processing letters, VOL. 12, NO. 9, 2005

قيم البحث

2786 - جامعة البعث 2017 ورقة بحثية

تهدف هذه الدراسة إلى تحديد درجة المشكلات النفسية و الأكاديمية و الاقتصادية التي يواجهها الطلبة ذوي الاحتياجات الخاصة (الإعاقة السمعية و البصرية) في كلية الآداب في جامعة دمشق و التعرف على الفروق في هذه المشكلات بين أفراد عينة البحث. تألفت العينة من / 27 / طالباً و طالبة من طلبة كلية الآداب في جامعة دمشق، جرى اختيارهم بطريقة قصدية.

الإعاقة السمعية المشكلات النفسية و الأكاديمية و الاقتصادية الإعاقة البصرية طلبة المرحلة الجامعية psychological academic and economic problems visual handicapped hearing handicapped undergraduates المزيد..

دور البصمة الصوتية و البصرية و مدى مشروعيتهما في الإثبات الجزائي

3078 - جامعة البعث 2017 ورقة بحثية

فسنعرض في هذا البحث أشهر البصمات المستحدثة في التحقيق الجنائي و هي البصمة الصوتية و البصرية, و أوضحنا إن لهذه البصمات تطبيقات تهم المختصين في علم الجريمة و الأدلة الجنائية, فمن خلال البصمة الصوتية و البصرية يمكن التعرف على المتهمين و ادانتهم بجريم تهم أو رفعها عنهم, كما توصلنا أخيرا إلى أن هذا النوع من البصمات تخضع لمبدأ مشروعية الدليل كغيرها من أدلة الإثبات, و لا شيء يمنع من استخدامهما في الإثبات الجزائي مع مراعاة بعض الضوابط التي لا غنى عنها لمشروعيتهما.

مشروعية legality بصمة صوتية بصرية دور البصمة The role of footprint visual audio imprint المزيد..

تحسين جيل وتقييم القصص البصرية عبر الاتساق الدلالي

702 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تعتبر تصور القصة مهمة غير مسجلة تقع عند تقاطع العديد من الاتجاهات البحثية المهمة في كل من رؤية الكمبيوتر ومعالجة اللغات الطبيعية. في هذه المهمة، نظرا لسلسلة من التسميات التوضيحية باللغة الطبيعية التي تنشأ قصة، يجب أن يولد الوكيل سلسلة من الصور التي ت توافق مع التسميات التوضيحية. قدم العمل السابق نماذج تائحة تكرار تتفوق نماذج توليف النص إلى الصورة في هذه المهمة. ومع ذلك، هناك مجال لتحسين الصور التي تم إنشاؤها من حيث الجودة البصرية والتماسك والأهمية. نقدم عددا من التحسينات إلى نهج النمذجة السابقة، بما في ذلك (1) إضافة إطار تعليمي مزدوج يستخدم تقسيم الفيديو لتعزيز المحاذاة الدلالية بين القصة والصور التي تم إنشاؤها، (2) آلية تحويل النسخ المتوسطة تصور القصة، و (3) من المحولات المستندة إلى مارت إلى التفاعلات المعقدة بين الإطارات. نقدم دراسات الاجتثاث لإظهار تأثير كل تقنيات من هذه التقنيات على القوة المنتجة للنموذج لكل من الصور الفردية وكذلك السرد بأكمله. علاوة على ذلك، بسبب تعقيد الطبيعة والطبيعة الإندنية للمهمة، لا تعكس مقاييس التقييم القياسية الأداء بدقة. لذلك، فإننا نقدم أيضا استكشاف مقاييس التقييم للنموذج، ركز على جوانب الإطارات التي تم إنشاؤها مثل وجود / جودة الشخصيات الناتجة، والأهمية التعيينات، وتنوع الصور التي تم إنشاؤها. نقدم أيضا تجارب الارتباط لمقاييسنا الآلية المقترحة مع التقييمات البشرية.

improving generation visual stories semantic consistency تحسين الجيل القصص البصرية الاتساق الدلالي صناعة حمض الفوسفور المزيد..

الترجمة السمعية البصرية من خلال NMT وترجمة في سلسلة Netflix `الفتيات الكابلات

954 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في السنوات الأخيرة، أعاد ظهور منصات تدفق مثل Netflix أو HBO أو Amazon Prime Prieet في مجال الترفيه، والذي يعتمد بشكل متزايد على أوضاع الروائح أو الصوت على الصوت. ومع ذلك، يعرف القليل عن الترجمة السمعية البصرية عند التعامل مع محركات الترجمة الآلية الع صبية (NMT). تسعى ورقة العمل في العمل هذه إلى فحص الترجمات الإنجليزية من الحلقة الأولى للفتيات الكابلات الإسبانية سلسلة Netflix الشهيرة والنسخة المترجمة التي تم إنشاؤها بواسطة Google Translate و Deepl. سيساعدنا هذا التحليل في تحديد ما إذا كانت هناك اختلافات لغوية كبيرة يمكن أن تؤدي إلى سوء فهم أو صدمات ثقافية. تحقيقا لهذه الغاية، تتكون Corpus Compounts من البرنامج النصي الإسباني، المتاحة الترجمات الإنجليزية في Netflix والإصدار المترجم من البرنامج النصي. لتحليل البيانات، تم تصنيف الأخطاء بعد مصممة خطأ DQF / MQM وتم تقييمها باستخدام Metric Bleu التلقائي. تظهر النتائج أن محركات NMT تقدم ترجمات ذات نوعية جيدة، والتي بدورها قد تستفيد المترجمين الذين يعملون مع موارد الترفيه البصرية.

amazon prime video netflix series cable cable girls' أمازون رئيس الفيديو كابل سلسلة Netflix. الفتيات الكابلات صناعة حمض الفوسفور المزيد..

طرق الاتصال التربوي (السمعية و البصرية) (دراسة موضوعية في الحديث النبوي)

1348 - جامعة دمشق 2009 ورقة بحثية

أُحدثت في العالم الإسلامي كليات للتربية و معاهد للتعليم؛ تبنت قيم الآخرين و تجاربهم، متجاهلة تراث الأمة التربوي. و التاريخ أصدق شاهد، و الواقع خير برهان، ففي حين عادى الغرب العلم، و أقصى العلماء، أرسى الإسلام قواعد منهج تربوي ثبتت نجاعته، و وضع أسساً للبحث العلمي، و هدفت هذه الدراسة إلى توضيح أهم معالم التربية النبوية في تفعيل الوسائل السمعية و البصرية.

الحديث النبوي طرق الاتصال التربوي السمعية البصرية

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2107 - 0 - - Shamra Editor تم طرحه بمساحة ( الذكاء الاصناعي)

التعرف على الكلام

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة قرطبة الخاصة

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

تحسين استخراج السمات السمعية في الأنظمة السمعية البصرية للمتحدثين باللغة العربية

Improving the extraction of audio features In audio-visual Arabic systems

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة