ترغب بنشر مسار تعليمي؟ اضغط هنا

تحليل النماذج في الصور و التعرف عليها باستخدام الشبكات العصبونية

Pattern Analysis and detection in images using neural networks

3290   1   206   0 ( 0 )
 تاريخ النشر 2015
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يقدم البحث طريقة مطورة لكشف مكان نموذج الوجه في الصورة, و ذلك بجمع أكثر من تقنية لتحقيق أفضل نسبة كشف. يبنى نموذج لون بشرة باستخدام الفضاء اللوني (RGB) Red, Green, Blue, لكشف مناطق البشرة و ينتج المناطق المرشحة لتكون الوجه في الصورة. و من خلال تقنية الشبكة العصبونية يتم تدريب مجموعة من صور الوجوه و صور لغير الوجوه (الخلفية) ، بعد إسقاطها على حيز جزئي بواسطة تقنية تحليل المعاملات الأولية بهدف تقليل أبعاد صور التدريب و تقليل الزمن الحسابي. يوجد تعديلين للاستخدام التقليدي للشبكة العصبونية و هما: أولاً, تختبر الشبكة العصبونية مناطق الصورة المرشحة لتكون وجوه فقط, بالنتيجة يتم تقليل حيز البحث. ثانياً, يتم تكييف نافذة مسح الشبكة العصبونية لصورة الدخل, بحيث تعتمد على حجم المنطقة المرشحة لتكون وجه مما يمكن نظام الكشف من كشف الوجوه بحجوم متعددة.


ملخص البحث
يقدم هذا البحث طريقة مطورة لكشف مكان نموذج الوجه في الصور باستخدام الشبكات العصبونية. يعتمد النظام على دمج تقنيات متعددة لتحقيق أفضل نسبة كشف، حيث يتم بناء نموذج لون بشرة باستخدام الفضاء اللوني RGB لكشف مناطق البشرة. يتم تدريب الشبكة العصبونية بمجموعة من صور الوجوه وغير الوجوه بعد إسقاطها على حيز جزئي باستخدام تقنية تحليل المعاملات الأولية لتقليل أبعاد الصور وتقليل الزمن الحسابي. يتضمن النظام تعديلين رئيسيين: الأول هو اختبار الشبكة العصبونية لمناطق الوجه المرشحة فقط، مما يقلل حيز البحث، والثاني هو تكييف نافذة مسح الشبكة العصبونية اعتماداً على حجم المنطقة المرشحة، مما يمكن النظام من كشف الوجوه بأحجام متعددة. تم استخدام قاعدة بيانات CBCL لتدريب النظام واختباره، وأظهرت النتائج فعالية النظام في كشف الوجوه بدقة عالية ونسبة خطأ منخفضة مقارنة بطرق أخرى.
قراءة نقدية
دراسة نقدية: يعتبر البحث خطوة مهمة في مجال كشف الوجوه باستخدام الشبكات العصبونية، حيث يقدم تحسينات ملحوظة في دقة الكشف وتقليل الزمن الحسابي. ومع ذلك، يمكن تحسين البحث من خلال دراسة تأثير الإضاءة المختلفة وزوايا الوجه المتعددة على دقة النظام. كما يمكن تطوير النظام ليعمل في الزمن الحقيقي، مما يزيد من تطبيقاته العملية. بالإضافة إلى ذلك، يمكن تحسين قاعدة البيانات المستخدمة لتشمل مجموعة أوسع من الصور تحت ظروف مختلفة لتحسين دقة النظام.
أسئلة حول البحث
  1. ما هي التقنية الأساسية المستخدمة لتقليل أبعاد صور التدريب في هذا البحث؟

    التقنية الأساسية المستخدمة لتقليل أبعاد صور التدريب هي تقنية تحليل المعاملات الأولية (PCA).

  2. ما هو الهدف الرئيسي من تعديل نافذة مسح الشبكة العصبونية في النظام المقترح؟

    الهدف الرئيسي من تعديل نافذة مسح الشبكة العصبونية هو تمكين النظام من كشف الوجوه بأحجام متعددة اعتماداً على حجم المنطقة المرشحة لتكون وجه.

  3. ما هي نسبة الكشف الصحيحة التي حققها النظام المقترح في هذا البحث؟

    حقق النظام المقترح نسبة كشف صحيحة تصل إلى 99.2% مع نسبة خطأ إيجابي منخفضة تبلغ 0.4%.

  4. ما هي التحديات الرئيسية التي تواجه عملية كشف الوجه في الصور كما ذكرها البحث؟

    التحديات الرئيسية تشمل تعدد أحجام الوجوه في الصورة، الحجب من قبل أشياء أخرى، تعبيرات الوجه المختلفة، زاوية الوجه بالنسبة للكاميرا، وجود مواصفات متغيرة مثل اللحية والشارب، الإضاءة غير المناسبة، وتدني مواصفات الكاميرا.


المراجع المستخدمة
CHELLAPPA, R. ; AMIT, K. R. and SHAOHUA, K. Z."Recognition of Humans and Their Activities Using Video".United States of America,First Edition, 2012
YANG,M.H. ; KRIEGMAN, J. D and AHUJA,N." Detecting Faces in Images: A Survey". IEEE 3-Transactions on Pattern Analysis and Intelligence,Vol.24,No.1,2004,34- 58
YANG,G. ; HUANG,T.S. “Human Face Detection in Complex Background.” Pattern Recognition, Vol. 27, No. 1,2007, 53-63
قيم البحث

اقرأ أيضاً

يقدم هذا البحث تقنية جديدة لتحسين عامل الاستطاعة بالاعتماد على الشبكات العصبونية الاصطناعية. حيث يتم التحكم بمحرك متواقت عن طريق متحكم عصبوني للتعامل مع مشكلة تعويض الاستطاعة الردية للنظام، و ذلك بهدف تحسين عامل الاستطاعة. تم في هذا البحث نمذجة النظ ام الكهربائي و المتحكم العصبوني باستخدام برنامج ماتلاب، و قد بينت النتائج أن هذه الطريقة قد تغلبت على المشاكل التي تحدث عند استخدام الطرق التقليدية (استخدام المكثفات الساكنة)، كالتأخير الزمني و التغيرات الخطوية في تعويض الاستطاعة الردية، بالإضافة إلى السرعة بالمقارنة مع التعويض باستخدام المكثفات.
سنقدم في هذا البحث منهجية علمية للتنبؤ قصيرة جدا بالحمولات الكهربائية للمنظومة الكهربائية السورية أي التنبؤ بهذه الحمولات لعدة ساعات قادمة و قد أطلقنا على هذا النوع من التنبؤ التنبؤ العملياتي, تعتمد هذه المنهجية على استخدام الشبكات العصبية الصناعية.
نقدم في هذا البحث دراسة علمية متقدمة متطورة و تواكب الدراسات و التكنولوجيا الحديثة حول التنبؤ قصير الأمد جدا بالأحمال الكهربائية و تطبيق الدراسة من أجل التنبؤ بالحمل الكهربائي في المنظومة الكهربائية السورية الأساسية حيث تم دراسة التنبؤ بهذا الحمل لأر بع ساعات قادمة وفق المعيار الذي تتبعه وزارة الكهرباء في القطر لكن بفواصل زمنية قصيرة تبلغ عشرة دقائق بين التنبؤ و التنبؤ الذي يليه و قد أطلقنا عليه التنبؤ الآني.
قمنا من خلال هذا البحث بتصميم برنامج يهدف إلى تحديد النقاط الحرجة التي يمكن أن تسبب إنهيار التوتر، و بناء شبكة عصبونية ضمن بيئة برمجيات ماتلاب مهمتها التنبؤ بقيمة الاستطاعة العظمى التي يمكن نقلها على نظام القدرة الكهربائية في ظروف انهيار التوتر دو ن أن ينهار نظام القدرة، و تدريبها على حالات واقعية تعرضت لها أنظمة القدرة الكهربائية، ثم قمنا بتطبيق هذه الشبكة العصبونية المدربة على شبكة مرجعية IEEE-14 Bus-bar لإختبار أدائها و مقارنة النتائج.
في السنوات الأخيرة نمت مشكلة تصنيف الكائنات في الصّور نتيجة لمتطلبات القطاع الصناعي.على الرّغم من تعدد التقنيات المستخدمة للمساعدة في عملية التصنيف SIFT Scale Invariant Feature Transforms، ORB Oriented Fast And Rotated Brief , SURF Speed Up Robust Features، إضافة لشبكات التعلم العميق Deep Learning Neural Network DNN والشبكات العصبونية الالتفافية Convolutional Neural Network CNN، فإن الأنظمة المقترحة لمعالجة هذه المشكلة تفتقر للحل الشّامل للصعوبات المتمثلة بوقت التّدريب الطّويل والذاكرة العائمة أثناء عملية التدريب، وانخفاض معدّل التصنيف. تعتبر الشبكات العصبونية الالتفافيةConvolutional Neural Networks (CNNs) من أكثر الخوارزميات استخداما لهذه المهمة، فقد كانت نموذجا حسابيا لتحليل البيانات الموجودة في الصور. تم اقتراح نموذج شبكة التفافية عميقة جديد لحل المشاكل المذكورة أعلاه. يهدف البحث إلى إظهار أداء نظام التّعرف باستخدام شبكاتCNNs على الذّاكرة المتاحة وزمن التدريب وذلك من خلال منهجة متغيرات مناسبة للشبكة العصبونية الالتفافية. قاعدة البيانات المستخدمة في هذا البحث هي CIFAR10 المكونة من60000 صورة ملونة تنتسب لعشرة أصناف، حيث أن كل 6000 صورة تكون لصنف من هذه الأصناف. يوجد 50000 صورة للتدريب و 10000 صورة للاختبار. حقق النموذج لدى اختباره على عينة من الصور المنتقاة من قاعدة البيانات CIFAR10 معدل تصنيف 98.87%.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا