ترغب بنشر مسار تعليمي؟ اضغط هنا

التصنيف الآلي لتعابير الوجه باستخدام تقنيات معالجة الصورة (الخوف – الاشمئزاز – الحزن – التفاجؤ – الغضب – السعادة – التعبير الطبيعي)

Automatic Facial Expression Classification Using Image Processing Technique ( Fear – disgust – sadness – Surprise – Anger – Happiness – Natural )

3095   2   103   0 ( 0 )
 تاريخ النشر 2015
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يقدم هذا البحث خوارزمية لتصميم نظام يقوم بتصنيف التعابير القياسية السبعة لوجه الإنسان (الخوف – الاشمئزاز – الحزن – التفاجؤ – الغضب – السعادة – التعبير الطبيعي) باستخدام بعض تقنيات معالجة الصورة، حيث يتم تصنيف تعبير الوجه الموجود في الصورة المدخلة للنظام بالاعتماد على استخلاص سمات المظهر من الوجه المعتبر و إدخالها إلى شبكة عصبونية لإتمام عملية التصنيف و ذلك باستخدام لغة البرمجة Matlab. تم إنجاز العمل على مراحل متعددة و هي: (مرحلة تجميع الصور، مرحلة المعالجة المسبقة للصورة، مرحلة استخلاص السمات، مرحلة تدريب الشبكة العصبونية، مرحلة التصنيف و الاختبار). و قد تمكن نظامنا المعتبر من تحقيق أعلى نسبة تصنيف عند تعبير الغضب حيث وصلت 100% , بينما أدنى نسبة تصنيف كانت عند تعبير الحزن و هي 50%.


ملخص البحث
يقدم هذا البحث خوارزمية لتصميم نظام يقوم بتصنيف التعابير القياسية السبعة لوجه الإنسان (الخوف – الاشمئزاز - الحزن - التقاجؤ - الغضب - السعادة - التعبير الطبيعي) باستخدام بعض تقنيات معالجة الصورة. يتم تصنيف تعبير الوجه الموجود في الصورة المدخلة للنظام بالاعتماد على استخلاص سمات المظهر من الوجه وادخالها إلى شبكة عصبونية لإتمام عملية التصنيف باستخدام لغة البرمجة Matlab. يتكون النظام من عدة مراحل: تجميع الصور، المعالجة المسبقة للصورة، استخلاص السمات، تدريب الشبكة العصبونية، التصنيف والاختبار. حقق النظام أعلى نسبة تصنيف عند تعبير الغضب بنسبة 100%، بينما كانت أقل نسبة عند تعبير الحزن بنسبة 30%. تم استخدام قاعدة بيانات مكونة من صور تعابير الوجه القياسية لعشرة أشخاص، حيث تم تصنيف الصور باستخدام المرشح الغوصي وشبكة SOM. تم مقارنة نتائج النظام مع دراسة مرجعية، حيث أظهرت النتائج أن النظام المقترح حقق أداءً أفضل في بعض التعابير وأداءً أقل في تعابير أخرى. تم تقديم توصيات لتحسين النظام بزيادة عدد صور التعابير واستخدام نوع آخر من الشبكات العصبونية.
قراءة نقدية
دراسة نقدية: يعتبر هذا البحث خطوة مهمة نحو تطوير نظم التعرف على تعابير الوجه باستخدام تقنيات معالجة الصورة والشبكات العصبونية. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، قاعدة البيانات المستخدمة صغيرة نسبياً، مما قد يؤثر على دقة النتائج. يفضل زيادة عدد الصور والأشخاص في قاعدة البيانات للحصول على نتائج أكثر دقة. ثانياً، النظام يعتمد بشكل كبير على المرشح الغوصي وشبكة SOM، يمكن تجربة أنواع أخرى من الشبكات العصبونية وتقنيات معالجة الصورة لتحسين الأداء. ثالثاً، لم يتم تناول تأثير العوامل الخارجية مثل الإضاءة وزوايا التصوير على دقة التصنيف، وهو ما يمكن أن يكون له تأثير كبير في التطبيقات العملية. وأخيراً، يمكن تحسين النظام بإضافة ميزات أخرى من صورة التعبير ودراسة أثرها على دقة النتائج.
أسئلة حول البحث
  1. ما هي التعابير القياسية السبعة التي تم تصنيفها في هذا البحث؟

    التعابير القياسية السبعة هي: الخوف، الاشمئزاز، الحزن، التقاجؤ، الغضب، السعادة، والتعبير الطبيعي.

  2. ما هي أعلى نسبة تصنيف حققها النظام ولأي تعبير؟

    أعلى نسبة تصنيف حققها النظام كانت 100% لتعبير الغضب.

  3. ما هي أقل نسبة تصنيف حققها النظام ولأي تعبير؟

    أقل نسبة تصنيف حققها النظام كانت 30% لتعبير الحزن.

  4. ما هي التوصيات التي قدمها الباحثون لتحسين النظام؟

    التوصيات تشمل: استخلاص عناصر وميزات أخرى من صورة التعبير، زيادة عدد صور التعابير في قاعدة البيانات، واستخدام نوع آخر من الشبكات العصبونية للتحقق من صور التعابير وتصنيفها.


المراجع المستخدمة
C. C. Chibelushi , F. Bourel , Facial Expression Recognition: A Brief Tutorial Overview, School of Computing, University, 2002
S. Moore, R. Bowden , Local binary patterns for multi-view facial expression recognition , / Computer Vision and Image Understanding 115 (2011) 541–558,2011
K. Mehotra, , C. K. Mohan and S. Ranka, , Self-Organizing Maps (SOMs) , Prentice Hall. pp. 169-187
قيم البحث

اقرأ أيضاً

يقدم هذا البحث خوارزمية لتصميم نظام يقوم بتصنيف التعبيرات القياسية السبعة لوجه الانسان: الخوف – الاشمئزاز - الحزن - التفاجؤ - الغضب - السعادة - التعبير الطبيعي. حيث يتم تصنيف تعبير الوجه الموجود في الصورة المدخلة للنظام بالاعتماد على استخلاص سمات ال مظهر من الوجه المعتبر وادخالها إلى شبكة عصبونية لإتمام عملية التصنيف و ذلك باستخدام لغة البرمجة Matlab
مع زيادة الشبكات الاجتماعية ، بدأ الناس في مشاركة المعلومات عبر أنواع مختلفة من وسائل التواصل. في هذا العمل قمنا بالاستفادة من قصص الأطفال وتوظيفها لتعليم الاطفال وذلك عن طريق قراءة قصة لهم وتحويلها إلى نص ومعالجة النص باستخدام اللغات الطبيعية و استخراج المشاعر بشكل اتوماتيكي من هذه القصة و لتحقيق ذلك قمنا باستخدام عدة تقنيات و دمجها و قارنا بين نتائجها على عدد من القصص القصيرة المخصصة للأطفال حيث تم استخدام كل من التقنيات المختلفة غير الخاضعة للإشراف مثال Dictionary Basedأو خاضعة للإشراف كالشبكات العصبونية التي تعتمد على البيانات لتحليل المشاعر حيث استخدمنا مصنفات متعددة وهي Support Vector Machineوstochastic Gradient Descent و Decision Tree و Random ForestوNaïve BayesوK-Nearest NeighborوNearest Centroidكذلك استخدمنا الشبكات العصبونية العميقة كمثال الشبكات العصبونية التكرارية RNNو في النهاية تم التوصل إلى استنتاج المشاعر الصحيحة للقصة من خلال Dictionary Basedالتي اعطت افضل دقة ثم إظهار صورة التعبير الصحيح الذي يبين للطفل التعبير المراد إبداؤه عند سماع أحداث هذه القصةليتفاعل معه ويتعلم التعبير الصحيح
يقدم البحث طريقة مبتكرة لقياس طول عظم فخذ الجنين في الصور فوق الصوتية, حيث يقوم بتقليل كمية الضجيج الموجودة في تلك الصور, و من ثم تحويلها إلى الشكل الثنائي و اجراء عمليات مورفولوجية لتجزئة عظم الفخذ و عزله عن باقي عناصر الصورة, ثم يستخدم كاشف حواف من أجل إيجاد حواف العظم, و يطبق بعد ذلك تحويل هوف لكشف الخطوط المستقيمة في الصورة, ليقوم بمراكبة المستقيمات الناتجة على الصورة الأصلية, و المستقيم الأبرز و الأطول هو المستقيم المقابل لعظم الفخذ, و يتم حساب طوله بالميلليمتر.
يقدم البحث دراسة لأنواع التشوه الدائري (Radial Distortion) الناتج عن الكاميرات الرقمية، مثل التشوه التحدبي (Barrel Distortion) و التشوه التقعري (Pincushion Distortion). تم استخدام توابع MATLAB الخاصة بتقنيات معالجة الصورة لتصحيح التشوه التحدبي النات ج عن العدسات المتسعة الزاوية (wide angle lenses) للكاميرات الرقمية، حيث تم إيجاد نموذج رياضي يعبر عن التشوه التحدبي، و وضع خوارزمية لتصحيح هذا التشوه، تعتمد الخوارزمية على إيجاد القيم الدقيقة لبارامترات المعادلة التي تعبر عن التشوه، و مقارنة الصورة بنموذج الشبكة القياسي لتحديد البيكسلات المسببة للتشوه في الصورة و إعادتها إلى مكانها الصحيح، للحصول في النهاية على صورة مصححة أقرب ما تكون إلى الصورة الحقيقية.
يقدم البحث - تصميم نموذج مخبري لأتمتة اربع عقد مرورية باستخدام معالجة الصورة - مقترحا لنظام مروري مؤتمت مرئيا , وذلك بتنظيم عمل عقدة مرورية اعتمادا على المعالجة الرقمية لصور اربع كاميرات مركبة على التقاطع,ما يخدم عمليات تنظيم السير بشكل أق رب للمثالية ، بحيث يتم تخفيف الاختناقات المرورية، التي قد تسبب مشاكل عديدة، منها هدر الوقت والتأخير عن المواعيد. يحاول البحث الارتقاء بالعملية التنظيمية لسير العربات والمركبات والسيارات، إذ يقدم طريقة فعالة لأتمتة إشارات المرور والتي تعتمد على حساب كثافة السيارات الموجودة في كل شارع من خلال عمليات معالجة الصور الواردة من تلك الشوارع إلى الحاسوب المركزي، الذي يصدر بدوره الأوامر المناسبة من تمرير أوإيقاف لمتحكمات العقدة المرورية، حيث تقوم الأخيرة بتشغيل وإطفاء المصابيح اللونية المناسبة، بمعنى آخر تقوم بتنفيذ الأوامر الواردة إليها. يتضمن هذا البحث تطبيق ا عملي ا لتقنيات معالجة الصورة من أجل حساب كثافة السيارات الموجودة في كل شارع، ويحتوي تطبيق عملي للمتحكمات المصغرة في مجال أتمتة وقيادة إشارات المرور، وكذلك تجسيد من أجل تحقيق الترابط الشبكي النجمي ،USART عملي لوحدة الاتصال التسلسلية المتزامنة وغير المتزامنة بين متحكمات العقد المرورية مع المعالج المركزي، إضافة إلى تطبيق عملي للكاميرات الرقمية من أجل تحصيل الصور الرقمية منها لإجراء المعالجة عليها وتطبيق تقنيات معالجة الصورة لحساب كثافة السيارات وتحديد كمية السيارات في كل شارع من أجل اتخاذ القرار المناسب لفتح وإغلاقالإشارة المرورية بحيث يتم تحقيق مرور أكبر عدد ممكن من السيارات في شوارع محدودة الحجم. تم حساب الأطياف اللونية لكل صورة ثم إيجاد الفرق بينها وبين صورة الشارع، وهو خال من السيارات من أجل حساب مصفوفة الفوارق اللونية، وبالتالي حساب كثافة السيارات المتواجدة في كل شارع.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا