ترغب بنشر مسار تعليمي؟ اضغط هنا

التصنيف الآلي لتعبيرات الوجه باستخدام تقنيات معالجة الصورة - الخوف الاشمئزاز الحزن التفاجؤ الغضب السعادة التعبير الطبيعي

Automatic Facial Expression Classification Using Image Processing Technique ( Fear – disgust – sadness – Surprise – Anger – Happiness – Natural )

1090   1   13   0.0 ( 0 )
 تاريخ النشر 2013
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يقدم هذا البحث خوارزمية لتصميم نظام يقوم بتصنيف التعبيرات القياسية السبعة لوجه الانسان: الخوف – الاشمئزاز - الحزن - التفاجؤ - الغضب - السعادة - التعبير الطبيعي. حيث يتم تصنيف تعبير الوجه الموجود في الصورة المدخلة للنظام بالاعتماد على استخلاص سمات المظهر من الوجه المعتبر وادخالها إلى شبكة عصبونية لإتمام عملية التصنيف و ذلك باستخدام لغة البرمجة Matlab


ملخص البحث
تقدم هذه الرسالة نظامًا لتصنيف تعبيرات الوجه البشرية القياسية (الخوف، الاشمئزاز، الحزن، المفاجأة، الغضب، السعادة، التعبير الطبيعي) باستخدام تقنيات معالجة الصور. يتم تصنيف تعبير الوجه في الصورة المدخلة للنظام بناءً على استخراج سمات المظهر وإدخالها إلى شبكة عصبية (SOM) باستخدام لغة البرمجة Matlab. يتكون العمل من عدة مراحل تشمل تجميع الصور، المعالجة المسبقة، استخراج السمات، تدريب الشبكة العصبية، واختبار النظام. أظهرت النتائج أن النظام حقق أعلى نسبة تصنيف عند تعبير الغضب بنسبة 100%، بينما كانت أدنى نسبة عند تعبير الحزن بنسبة 50%. تعود نسبة الخطأ إلى إمكانية تصنيف الشبكة للشعور الموجود في الصورة إلى شعور آخر قريب منه بسبب المسافة الإقليدية. تم مقارنة النتائج مع دراسة مرجعية وأظهرت تحسنًا في بعض التعبيرات مثل الغضب، بينما كانت أقل دقة في تعبيرات أخرى مثل الحزن.
قراءة نقدية
دراسة نقدية: تعتبر هذه الرسالة خطوة مهمة في مجال التعرف على تعبيرات الوجه باستخدام الشبكات العصبية وتقنيات معالجة الصور. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، يمكن زيادة حجم قاعدة البيانات المستخدمة في التدريب لتحسين دقة التصنيف. ثانيًا، يمكن تجربة أنواع أخرى من الشبكات العصبية للتحقق من تأثيرها على دقة التصنيف. ثالثًا، يمكن تحسين معالجة الصور المسبقة لتقليل الضجيج بشكل أكثر فعالية. وأخيرًا، يمكن دمج تقنيات أخرى مثل التعلم العميق لتحسين الأداء العام للنظام.
أسئلة حول البحث
  1. ما هي التعبيرات الوجهية التي تم تصنيفها في هذه الدراسة؟

    التعبيرات الوجهية التي تم تصنيفها هي الخوف، الاشمئزاز، الحزن، المفاجأة، الغضب، السعادة، والتعبير الطبيعي.

  2. ما هي أعلى نسبة تصنيف حققها النظام؟

    أعلى نسبة تصنيف حققها النظام كانت عند تعبير الغضب بنسبة 100%.

  3. ما هي التقنية المستخدمة لاستخراج السمات من الصور؟

    التقنية المستخدمة لاستخراج السمات من الصور هي المرشح الغوصي (Gaussian filter).

  4. ما هي أسباب نسبة الخطأ في تصنيف التعبيرات؟

    تعود نسبة الخطأ إلى إمكانية تصنيف الشبكة للشعور الموجود في الصورة إلى شعور آخر قريب منه بسبب المسافة الإقليدية.


المراجع المستخدمة
N. Sebe, M. Lew, Y. Sun, I. Cohen, T. Gevers, and T. Huang, \Authentic facial expression analysis," Image and Vision Computing, vol. 25, no. 12, pp. 1856 .3113 ,0362
قيم البحث

اقرأ أيضاً

يقدم هذا البحث خوارزمية لتصميم نظام يقوم بتصنيف التعابير القياسية السبعة لوجه الإنسان (الخوف – الاشمئزاز – الحزن – التفاجؤ – الغضب – السعادة – التعبير الطبيعي) باستخدام بعض تقنيات معالجة الصورة، حيث يتم تصنيف تعبير الوجه الموجود في الصورة المدخلة للن ظام بالاعتماد على استخلاص سمات المظهر من الوجه المعتبر و إدخالها إلى شبكة عصبونية لإتمام عملية التصنيف و ذلك باستخدام لغة البرمجة Matlab. تم إنجاز العمل على مراحل متعددة و هي: (مرحلة تجميع الصور، مرحلة المعالجة المسبقة للصورة، مرحلة استخلاص السمات، مرحلة تدريب الشبكة العصبونية، مرحلة التصنيف و الاختبار). و قد تمكن نظامنا المعتبر من تحقيق أعلى نسبة تصنيف عند تعبير الغضب حيث وصلت 100% , بينما أدنى نسبة تصنيف كانت عند تعبير الحزن و هي 50%.
مع زيادة الشبكات الاجتماعية ، بدأ الناس في مشاركة المعلومات عبر أنواع مختلفة من وسائل التواصل. في هذا العمل قمنا بالاستفادة من قصص الأطفال وتوظيفها لتعليم الاطفال وذلك عن طريق قراءة قصة لهم وتحويلها إلى نص ومعالجة النص باستخدام اللغات الطبيعية و استخراج المشاعر بشكل اتوماتيكي من هذه القصة و لتحقيق ذلك قمنا باستخدام عدة تقنيات و دمجها و قارنا بين نتائجها على عدد من القصص القصيرة المخصصة للأطفال حيث تم استخدام كل من التقنيات المختلفة غير الخاضعة للإشراف مثال Dictionary Basedأو خاضعة للإشراف كالشبكات العصبونية التي تعتمد على البيانات لتحليل المشاعر حيث استخدمنا مصنفات متعددة وهي Support Vector Machineوstochastic Gradient Descent و Decision Tree و Random ForestوNaïve BayesوK-Nearest NeighborوNearest Centroidكذلك استخدمنا الشبكات العصبونية العميقة كمثال الشبكات العصبونية التكرارية RNNو في النهاية تم التوصل إلى استنتاج المشاعر الصحيحة للقصة من خلال Dictionary Basedالتي اعطت افضل دقة ثم إظهار صورة التعبير الصحيح الذي يبين للطفل التعبير المراد إبداؤه عند سماع أحداث هذه القصةليتفاعل معه ويتعلم التعبير الصحيح
يقدم البحث طريقة مبتكرة لقياس طول عظم فخذ الجنين في الصور فوق الصوتية, حيث يقوم بتقليل كمية الضجيج الموجودة في تلك الصور, و من ثم تحويلها إلى الشكل الثنائي و اجراء عمليات مورفولوجية لتجزئة عظم الفخذ و عزله عن باقي عناصر الصورة, ثم يستخدم كاشف حواف من أجل إيجاد حواف العظم, و يطبق بعد ذلك تحويل هوف لكشف الخطوط المستقيمة في الصورة, ليقوم بمراكبة المستقيمات الناتجة على الصورة الأصلية, و المستقيم الأبرز و الأطول هو المستقيم المقابل لعظم الفخذ, و يتم حساب طوله بالميلليمتر.
يقدم البحث دراسة لأنواع التشوه الدائري (Radial Distortion) الناتج عن الكاميرات الرقمية، مثل التشوه التحدبي (Barrel Distortion) و التشوه التقعري (Pincushion Distortion). تم استخدام توابع MATLAB الخاصة بتقنيات معالجة الصورة لتصحيح التشوه التحدبي النات ج عن العدسات المتسعة الزاوية (wide angle lenses) للكاميرات الرقمية، حيث تم إيجاد نموذج رياضي يعبر عن التشوه التحدبي، و وضع خوارزمية لتصحيح هذا التشوه، تعتمد الخوارزمية على إيجاد القيم الدقيقة لبارامترات المعادلة التي تعبر عن التشوه، و مقارنة الصورة بنموذج الشبكة القياسي لتحديد البيكسلات المسببة للتشوه في الصورة و إعادتها إلى مكانها الصحيح، للحصول في النهاية على صورة مصححة أقرب ما تكون إلى الصورة الحقيقية.
يقدم البحث - تصميم نموذج مخبري لأتمتة اربع عقد مرورية باستخدام معالجة الصورة - مقترحا لنظام مروري مؤتمت مرئيا , وذلك بتنظيم عمل عقدة مرورية اعتمادا على المعالجة الرقمية لصور اربع كاميرات مركبة على التقاطع,ما يخدم عمليات تنظيم السير بشكل أق رب للمثالية ، بحيث يتم تخفيف الاختناقات المرورية، التي قد تسبب مشاكل عديدة، منها هدر الوقت والتأخير عن المواعيد. يحاول البحث الارتقاء بالعملية التنظيمية لسير العربات والمركبات والسيارات، إذ يقدم طريقة فعالة لأتمتة إشارات المرور والتي تعتمد على حساب كثافة السيارات الموجودة في كل شارع من خلال عمليات معالجة الصور الواردة من تلك الشوارع إلى الحاسوب المركزي، الذي يصدر بدوره الأوامر المناسبة من تمرير أوإيقاف لمتحكمات العقدة المرورية، حيث تقوم الأخيرة بتشغيل وإطفاء المصابيح اللونية المناسبة، بمعنى آخر تقوم بتنفيذ الأوامر الواردة إليها. يتضمن هذا البحث تطبيق ا عملي ا لتقنيات معالجة الصورة من أجل حساب كثافة السيارات الموجودة في كل شارع، ويحتوي تطبيق عملي للمتحكمات المصغرة في مجال أتمتة وقيادة إشارات المرور، وكذلك تجسيد من أجل تحقيق الترابط الشبكي النجمي ،USART عملي لوحدة الاتصال التسلسلية المتزامنة وغير المتزامنة بين متحكمات العقد المرورية مع المعالج المركزي، إضافة إلى تطبيق عملي للكاميرات الرقمية من أجل تحصيل الصور الرقمية منها لإجراء المعالجة عليها وتطبيق تقنيات معالجة الصورة لحساب كثافة السيارات وتحديد كمية السيارات في كل شارع من أجل اتخاذ القرار المناسب لفتح وإغلاقالإشارة المرورية بحيث يتم تحقيق مرور أكبر عدد ممكن من السيارات في شوارع محدودة الحجم. تم حساب الأطياف اللونية لكل صورة ثم إيجاد الفرق بينها وبين صورة الشارع، وهو خال من السيارات من أجل حساب مصفوفة الفوارق اللونية، وبالتالي حساب كثافة السيارات المتواجدة في كل شارع.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا