ترغب بنشر مسار تعليمي؟ اضغط هنا

تصنيف الصور مع الشبكة العصبية التلافيفية العميقة باستخدام تينسور فلو ونقل التعلم

Image classification with Deep Convolutional Neural Network Using Tensorflow and Transfer of Learning

2147   2   11   0.0 ( 0 )
 نشر من قبل جامعة بغداد مقالة
 تاريخ النشر 2020
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

حققت خوارزمية التعلم العميق مؤخرًا الكثير من النجاح خاصة في مجال رؤية الكمبيوتر.يهدف البحث الحالي إلى وصف طريقة التصنيف المطبقة على مجموعة البيانات الخاصة بأنواع متعددة من الصور (صور الرادار ذي الفجوة المركبةSAR والصور ليست SAR) ، أستخدم نقل التعلم متبوعًا بأساليب الضبط الدقيق في مخطط التصنيف هذا . تم استخدام بنيات مدربة مسبقًا على قاعدة بيانات الصور المعروفهImageNet، تم استخدام نموذج VGG 16 بالفعل كمستخرج ميزات وتم تدريب مصنف جديد بناءً على الميزات المستخرجة .تركز بيانات الإدخال بشكل أساسي على مجموعة البيانات التي تتكون من خمس فئات فئة صور الرادارSAR (المنازل) وفئات الصور ليستSAR (القطط والكلاب والخيول والبشر). تم اختيار الشبكة العصبية التلافيفية (CNN) كخيار أفضل لـعملية التدريب لانها نتجت عن دقة عالية. لقد وصلنا إلى الدقة النهائية بنسبة 91.18٪ في خمس فئات مختلفة. تتم مناقشة النتائج من حيث احتمالية الدقة لكل فئة في تصنيف الصورة بالنسبة المئوية. تحصل فئة القطط على 99.6٪ ، بينما تحصل فئة المنازل على 100٪ وتحصل انواع آخرى من الفئات بمتوسط درجات 90٪ وما فوق.


ملخص البحث
تهدف هذه الورقة البحثية إلى وصف طريقة تصنيف الصور باستخدام الشبكات العصبية التلافيفية العميقة (CNN) ونقل التعلم باستخدام نموذج VGG16. تم تطبيق هذه الطريقة على مجموعة بيانات تحتوي على خمسة أنواع من الصور: صور الرادار ذي الفجوة المركبة (SAR) وصور غير SAR (القطط، الكلاب، الخيول، والبشر). استخدم الباحثون نموذج VGG16 كمستخرج ميزات، ثم قاموا بتدريب مصنف جديد بناءً على هذه الميزات. أظهرت النتائج أن دقة التصنيف وصلت إلى 91.18%، حيث حصلت فئة القطط على دقة 99.6% وفئة المنازل على دقة 100%. تم تقييم الأداء باستخدام مقاييس مثل الدقة، F1 Score، الاسترجاع، والدقة. تم استخدام مكتبة TensorFlow ولغة البرمجة بايثون لتنفيذ النموذج. استنتج الباحثون أن استخدام نقل التعلم مع الشبكات العصبية التلافيفية يعد طريقة فعالة لتصنيف الصور بدقة عالية ووقت تدريب قصير.
قراءة نقدية
دراسة نقدية: على الرغم من أن الورقة تقدم نتائج واعدة في تصنيف الصور باستخدام نقل التعلم والشبكات العصبية التلافيفية، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، لم يتم التطرق بشكل كافٍ إلى كيفية التعامل مع الصور غير المتوازنة في مجموعة البيانات، حيث يمكن أن يؤثر ذلك على دقة النموذج. ثانياً، لم يتم مناقشة تأثير حجم البيانات على أداء النموذج بشكل مفصل، حيث يمكن أن يكون لحجم البيانات دور كبير في تحسين أو تقليل دقة النموذج. بالإضافة إلى ذلك، كان من الممكن تقديم مقارنة مع نماذج أخرى لتوضيح مدى تفوق النموذج المستخدم. وأخيراً، كان من الممكن تقديم تحليل أعمق للأخطاء التي واجهها النموذج لتحسين الأداء في المستقبل.
أسئلة حول البحث
  1. ما هي الفئات الخمس التي تم استخدامها في مجموعة البيانات؟

    الفئات الخمس هي: القطط، الكلاب، الخيول، البشر، والمنازل (صور الرادار ذي الفجوة المركبة SAR).

  2. ما هو النموذج المستخدم كمستخرج ميزات في هذه الدراسة؟

    تم استخدام نموذج VGG16 كمستخرج ميزات.

  3. ما هي دقة التصنيف النهائية التي تم الوصول إليها في هذه الدراسة؟

    تم الوصول إلى دقة تصنيف نهائية بنسبة 91.18%.

  4. ما هي مكتبة البرمجة ولغة البرمجة التي تم استخدامها لتنفيذ النموذج؟

    تم استخدام مكتبة TensorFlow ولغة البرمجة بايثون لتنفيذ النموذج.


المراجع المستخدمة
ﻻ يوجد مراجع
قيم البحث

اقرأ أيضاً

تركز طرق تعلم الجهاز لتحليل المستندات المالية بشكل رئيسي على الجزء النصي.ومع ذلك، فإن الأجزاء العددية من هذه المستندات غنية أيضا بمحتوى المعلومات.من أجل تحسين تحليل النص المالي، يجب علينا أن نحقق المعلومات الرقمية في العمق.في ضوء ذلك، فإن الغرض من هذ ا البحث هو تحديد الارتباط بين CASCTAG المستهدف والأرقام المستهدفة في التغريدات المالية، التي تعد أكثر تحديا من تحليل الأخبار والوثائق الرسمية.في هذا البحث، قمنا بتطوير نهج خلط متعدد النماذج يدمج تمثيلات تشفير ثنائية الاتجاه من المحولات (بيرت) والشبكة العصبية التنافعية (CNN).نحن أيضا ترميز معلومات التبعية خلف النص إلى النموذج لاستخلاص الميزات الكامنة الدلالية.تظهر النتائج التجريبية أن نموذجنا يمكنه تحقيق أداء رائع ومقارنات تفوق.
يتم تطبيق مصنف النصوص بانتظام على النصوص الشخصية، وترك مستخدمي هذه المصنفين عرضة لخرق الخصوصية.نقترح حلا لتصنيف النص الذي يحفظه الخصوصية التي تعتمد على الشبكات العصبية التنافعية (CNNS) والحساب الآمن متعدد الأحزاب (MPC).تتيح طريقتنا استنتاج تسمية فئة لنص شخصي بهذه الطريقة (1) لا يتعين على مالك النص الشخصي الكشف عن نصها لأي شخص بطريقة غير مشفرة، و (2) مالك النصلا يتعين على المصنف أن يكشف عن المعلمات النموذجية المدربة إلى مالك النص أو أي شخص آخر.لإظهار جدوى بروتوكولنا لتصنيف النص الخاص العملي، نفذناها في Fronten Fresk Framepten المستندة إلى Pytorch، باستخدام مخطط تقاسم سري معروف جيدا في الإعداد الصادق وغير الغريب.نحن نختبر وقت تشغيل مصنف نصي المحفوظ في الخصوصية لدينا، وهو سريع بما يكفي لاستخدامه في الممارسة العملية.
يتطلب بناء نماذج لمهام اللغة الطبيعية الواقعية التعامل مع النصوص الطويلة والمحاسبة التبعيات الهيكلية المعقدة.ظهرت تمثيلات رمزية عصبية كوسيلة للجمع بين قدرات التفكير في الأساليب الرمزية، مع تعبير الشبكات العصبية.ومع ذلك، فقد صممت معظم الأطر الموجودة ل لجمع بين التمثيل العصبي والرمزي لمهام التعلم العلائقية الكلاسيكية التي تعمل على الكون من الكيانات والعلاقات الرمزية.في هذه الورقة، نقدم دراسنا، وهو إطار إعلاني مفتوح المصدر لتحديد النماذج العلائقية العميقة، مصممة لدعم مجموعة متنوعة من سيناريوهات NLP.يدعم إطارنا سهلا التكامل مع تشفير اللغة التعبيرية، ويوفر واجهة لدراسة التفاعلات بين التمثيل والاستدلالية والتعلم.
في السنوات الأخيرة نمت مشكلة تصنيف الكائنات في الصّور نتيجة لمتطلبات القطاع الصناعي.على الرّغم من تعدد التقنيات المستخدمة للمساعدة في عملية التصنيف SIFT Scale Invariant Feature Transforms، ORB Oriented Fast And Rotated Brief , SURF Speed Up Robust Features، إضافة لشبكات التعلم العميق Deep Learning Neural Network DNN والشبكات العصبونية الالتفافية Convolutional Neural Network CNN، فإن الأنظمة المقترحة لمعالجة هذه المشكلة تفتقر للحل الشّامل للصعوبات المتمثلة بوقت التّدريب الطّويل والذاكرة العائمة أثناء عملية التدريب، وانخفاض معدّل التصنيف. تعتبر الشبكات العصبونية الالتفافيةConvolutional Neural Networks (CNNs) من أكثر الخوارزميات استخداما لهذه المهمة، فقد كانت نموذجا حسابيا لتحليل البيانات الموجودة في الصور. تم اقتراح نموذج شبكة التفافية عميقة جديد لحل المشاكل المذكورة أعلاه. يهدف البحث إلى إظهار أداء نظام التّعرف باستخدام شبكاتCNNs على الذّاكرة المتاحة وزمن التدريب وذلك من خلال منهجة متغيرات مناسبة للشبكة العصبونية الالتفافية. قاعدة البيانات المستخدمة في هذا البحث هي CIFAR10 المكونة من60000 صورة ملونة تنتسب لعشرة أصناف، حيث أن كل 6000 صورة تكون لصنف من هذه الأصناف. يوجد 50000 صورة للتدريب و 10000 صورة للاختبار. حقق النموذج لدى اختباره على عينة من الصور المنتقاة من قاعدة البيانات CIFAR10 معدل تصنيف 98.87%.
نحن نعتبر التمثيل الهرمي للوثائق كرسوم بيانية واستخدام التعلم العميق الهندسي لتصنيفها إلى فئات مختلفة.في حين أن الشبكات العصبية الرسم البيانية يمكن أن تتعامل مع الهيكل المتغير بشكل فعال للمستندات التسلسل الهرمية باستخدام عمليات تمرير رسالة ثابتة للصب غ، فإننا نوضح أنه يمكننا الحصول على تحسينات إضافية على الأداء باستخدام عملية تجمع الرسوم البيانية الانتقائية المقترحة التي تنشأ من حقيقة أن بعض أجزاء التسلسل الهرمي ثابتةعبر وثائق مختلفة.طبقنا نموذجنا لتصنيف بروتوكولات التجريبية السريري (CT) إلى فئات كاملة وإنهاءها.نستخدم حقيبة من الكلمات القائمة على الأكياس، بالإضافة إلى تضيير مقرها المحولات مسبقا لفصل العقد الرسم البياني، وتحقيق F1 Squareesaround 0.85 على سجل CT واسع النطاق للجمهور حول بروتوكولات 360k.نوضح كذلك كيف يمكن للتجمع الانتقائي إضافة رؤى في التنبؤ بحالة إنهاء CT.نحن نجعل التعليمات البرمجية المصدرية والشقاقات DataSet يمكن الوصول إليها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا