ترغب بنشر مسار تعليمي؟ اضغط هنا

استخراج الطرق من صور الأقمار الصناعية باستخدام نموذج الشبكة العصبونية الالتفافية (+Deeplabv3): حالة دراسية في مدينة اللاذقية

Roads Extraction from Satellite Images using Convolution Neural Network Model (Deeplabv3+) A Case Study in Lattakia city

1162   3   0   0.0 ( 0 )
 تاريخ النشر 2023
  مجال البحث الذكاء الاصناعي
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تم تطبيق هذه الدراسة التجريبية على منصة غوغل كولاب السحابية، من خلال تنفيذ التعليمات البرمجية والمكتبات المتطورة في لغة البايثون، قمنا بإجراء المعالجة المسبقة لبيانات بحثنا لإعداد صور الحقيقة الأرضية، ثم تدريب النموذج، تطلبت عملية التدريب والتحقق (4) فترات، بحجم دفعة للبيانات (4) صور، تناقصت دالة الخسارة إلى حدودها الدنيا بقيمة (0.025)، واستغرق زمن التدريب ثلاث ساعات وعشرة دقائق، وذلك بالاستعانة بـوحدة معالجة الرسومات المتطورة (GPU) وذاكرة وصول عشوائي إضافية. حققنا نتائج جيدة في تقييم الدقة في صحة تنبؤات النموذج المدرب بقيمة (التقاطع إلى الاتحاد=0.953)، فتم اختباره على منطقتين مختلفين إحداهما سكنية وأخرى زراعية في مدينة اللاذقية، أظهرت النتائج أن النموذج (+DeepLabv3) المدرب في بحثنا يمكنه استخراج شبكة الطرق بدقة وفعالية، لكن أداؤه ضعيف في بعض المناطق التي تحوي أشجار بسبب تأثير الظلال على حواف الطرق، وحيث تكون الخصائص الطيفية مشابهة للطرق كأسطح بعض المباني، وهو غير صالح لاستخراج الطرق الفرعية وغير المعبدة. قدم البحث عدة توصيات بتحسين أداء النموذج (+Deeplabv3) في استخراج الطرق من صور الأقمار الصناعية عالية الدقة، بما يفيد في تحديث خرائط الطرق وأعمال التخطيط الحضري.


ملخص البحث
يهدف هذا البحث إلى استخراج الطرق من صور الأقمار الصناعية باستخدام نموذج الشبكة العصبونية الالتفافية العميقة (Deeplabv3+). تم تطبيق الدراسة على منصة غوغل كولاب باستخدام مكتبات بايثون المتطورة. تضمنت العملية معالجة مسبقة للبيانات، تدريب النموذج، والتحقق من أدائه. استغرقت عملية التدريب ثلاث ساعات وعشرة دقائق باستخدام وحدة معالجة الرسومات المتطورة (GPU) وذاكرة وصول عشوائي إضافية. أظهرت النتائج دقة عالية في استخراج الطرق (IoU = 0.953)، ولكن النموذج واجه صعوبات في بعض المناطق مثل تلك التي تحتوي على ظلال الأشجار أو خصائص طيفية مشابهة للطرق. قدم البحث توصيات لتحسين أداء النموذج في استخراج الطرق من صور الأقمار الصناعية عالية الدقة، مما يسهم في تحديث خرائط الطرق وأعمال التخطيط الحضري.
قراءة نقدية
دراسة نقدية: على الرغم من أن البحث قدم نموذجًا فعالًا لاستخراج الطرق من صور الأقمار الصناعية، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، النموذج يواجه صعوبات في التعامل مع الظلال والأجسام ذات الخصائص الطيفية المشابهة للطرق، مما يشير إلى ضرورة تحسين معالجة البيانات المسبقة أو تعديل النموذج ليكون أكثر دقة في هذه الحالات. ثانياً، لم يتم اختبار النموذج على نطاق واسع من البيانات المتنوعة، مما قد يؤثر على تعميم النتائج. أخيرًا، يمكن أن تكون هناك حاجة إلى تحسينات إضافية لاستخراج الطرق الفرعية وغير المعبدة بشكل أكثر دقة.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من البحث؟

    الهدف الرئيسي هو استخراج الطرق من صور الأقمار الصناعية باستخدام نموذج الشبكة العصبونية الالتفافية العميقة (Deeplabv3+).

  2. ما هي المنصة المستخدمة لتطبيق الدراسة؟

    تم تطبيق الدراسة على منصة غوغل كولاب باستخدام مكتبات بايثون المتطورة.

  3. ما هي دقة النموذج في استخراج الطرق؟

    حقق النموذج دقة عالية في استخراج الطرق بقيمة (IoU = 0.953).

  4. ما هي التحديات التي واجهها النموذج في استخراج الطرق؟

    واجه النموذج صعوبات في استخراج الطرق في المناطق التي تحتوي على ظلال الأشجار أو خصائص طيفية مشابهة للطرق، وكذلك في استخراج الطرق الفرعية وغير المعبدة.


المراجع المستخدمة
The purpose of this paper is to extract roads from satellite images, based on developing the performance of the deep convolutional neural network model (Deeplabv3+) forroads segmentation, and to evaluate and test the performance of this model after training on our data.This experimental study was applied atGoogle Colab cloud platform, by software instructions and advanced libraries in the Python.We conducted data pre -processing to prepare ground truth masks,thenwe trained the model.Thetraining and validation process required (Epochs=4), by(Patch Size=4images).The Loss function decreased to its minimum value (0.025). Training time was three hours and ten minutes, aided by the advanced Graphics Processing Unit (GPU) and additional RAM.We achieved good results in evaluating the accuracy of the predictions of the trained model (IoU = 0.953). It was tested on two different areas, one of which is residential and the other agricultural in Lattakia city. The results showed that the trained model (DeepLabv3+) in our research can extract the road network accurately and effectively.But its performance is poor in some areas which includes tree shadows on the edges of the road, and where the spectral characteristics are similar to the road, such as the roofs of some buildings, and it is invalid for extracting side and unpaved roads. The research presented several recommendations to improve the performance of the (Deeplabv3+) in extracting roads from high-resolution satellite images, which is useful for updating road maps and urban planning works.
Christopher, S.;Christopher, H. DeepLearningNeuralNetworks forLandUse LandCoverMapping. IGARSS -IEEE International Geoscience and Remote Sensing Symposium, 2018, pp. 2995–2990
A Beginner’s Guide to Segmentation in Satellite Images: Walking through Machine Learning Techniques for Image Segmentation and Applying Them to Satellite Imagery. https://www.gsitechnology.com/Beginners-Guide-to-Segmentation-in-Satellite-Images(Accessed95-92-2022)
Chen, L.; Qianli, Z.; Papandreou, G.; Schroff, F.; Adam,H.Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation, Computer Vision –ECCV, 2018, pp 833–851
Darwishe, D.; Mohammad, A.; Chaaban, F. Developing a Model of Deep Learning by ANNs for Urban Areas Extraction from Remote Sensing Images -Study Area: HomsTartous, Al-Baath University Journal, V. 43, NO. 7, 2021, PP.11-42
قيم البحث

اقرأ أيضاً

نقدم في هذا البحث خوارزمية جديدة لأتمتة عملية كشف و استخراج الأبنية من صور الأقمار الصناعية, و تتميز هذه الخوارزمية عن غيرها كونها تتغلب على بعض المعوقات التي شكلت محدودية في الكشف ضمن طرق و خوارزميات أخرى مثل الاختلاف في شكل و لون و ارتفاع الأبني ة, و عدم الحاجة لصور متعددة الطيف أو غيرها من البيانات المعقدة أو ذات الكلفة العالية.
تشكّل هذه الدراسة خطوة تمهيدية لوضع موديل رياضي للتنبؤ بالحوادث المرورية في مدينة اللاذقية، يعتمد على عدد من العوامل الخارجية، والتي تشمل كلّاً من الخصائص الهندسية، والغزارات المرورية، وبيانات الحوادث المرورية. وأما هدفها الرئيسي فهو تخفيض عدد الحواد ث المرورية المتوقعة مستقبلاً على الشوارع الرئيسية في المدينة، حيث تمت الدراسة على شوارع شريانية مختلفة فيها من حيث أهميتها ومن حيث عدد الحوادث المرورية المسجلة عليها، ومن حيث تنوع خصائصها هندسياً، وذلك من أجل الإلمام الكافي بظروف الحركة المرورية في المدينة اعتماداً على أسباب مختلفة، لا تعتمد على السلوك الإنساني للسائقين أو على خصائص العربة. تم إجراء تحليل إحصائي لبيانات الحوادث المرورية للأعوام 2014 و 2015 و 2016 و 2017 على الشوارع المدينية في مدينة اللاذقية، حيث تم تصنيف الحوادث حسب خطورتها وزمن حدوثها ومكان وقوعها، وتمّ جمع البيانات اللازمة ورقمنتها ضمن بيئة برمجية في برنامج Excel Microsoft، ومن ثم بناء نموذج التنبؤ باستخدام أداة الشبكات العصبونية الصنعية في برنامج الماتلاب MATLAB، حيث تمّ إدخال بيانات 319 حادثاً مرورياً كانت قد سُجلت في الأعوام 2015 و 2016 و 2017، والتي تمّ تقسيمها في ثلاث مجموعات( التدريب والتحقق والاختبار). أعطت الشبكة العصبونية ذات الهيكلية(10-10-1) قيماً عالية لمعامل الارتباط، حيث بلغت قيمة R الكلية خلال المراحل الثلاث 0.931236 ، وهي قيمة قريبة جداً من الواحد، وبالتالي الشبكة المصممة مثالية وتحقق الاستجابة للتنبؤ بالحوادث المرورية شهرياً وبدقة عالية جداً.
يهدف البحث إلى تقديم دراسة مرجعيّة مفصلة عن استخدام الشبكات العصبونية الإلتفافية (CNNs) في استخراج الميزات (Features) من الصور. وسيتطرق البحث إلى التعريف بمعنى الميزات (Features) الخاصة بالصور وأهميتها في تطبيقات معالجة الصورة. وسيتم أيضاً التعريف بالشبكات العصبونية الإلتفافية (CNNs) وبنيتها و طريقة عملها وأنواع المقاربات والمنهجيات المستخدمة في تدريبها لاستخراج الميزات (Features) من الصور.
يقدم البحث طريقة مطورة لكشف مكان نموذج الوجه في الصورة, و ذلك بجمع أكثر من تقنية لتحقيق أفضل نسبة كشف. يبنى نموذج لون بشرة باستخدام الفضاء اللوني (RGB) Red, Green, Blue, لكشف مناطق البشرة و ينتج المناطق المرشحة لتكون الوجه في الصورة. و من خلال تقنية الشبكة العصبونية يتم تدريب مجموعة من صور الوجوه و صور لغير الوجوه (الخلفية) ، بعد إسقاطها على حيز جزئي بواسطة تقنية تحليل المعاملات الأولية بهدف تقليل أبعاد صور التدريب و تقليل الزمن الحسابي. يوجد تعديلين للاستخدام التقليدي للشبكة العصبونية و هما: أولاً, تختبر الشبكة العصبونية مناطق الصورة المرشحة لتكون وجوه فقط, بالنتيجة يتم تقليل حيز البحث. ثانياً, يتم تكييف نافذة مسح الشبكة العصبونية لصورة الدخل, بحيث تعتمد على حجم المنطقة المرشحة لتكون وجه مما يمكن نظام الكشف من كشف الوجوه بحجوم متعددة.
في السنوات الأخيرة نمت مشكلة تصنيف الكائنات في الصّور نتيجة لمتطلبات القطاع الصناعي.على الرّغم من تعدد التقنيات المستخدمة للمساعدة في عملية التصنيف SIFT Scale Invariant Feature Transforms، ORB Oriented Fast And Rotated Brief , SURF Speed Up Robust Features، إضافة لشبكات التعلم العميق Deep Learning Neural Network DNN والشبكات العصبونية الالتفافية Convolutional Neural Network CNN، فإن الأنظمة المقترحة لمعالجة هذه المشكلة تفتقر للحل الشّامل للصعوبات المتمثلة بوقت التّدريب الطّويل والذاكرة العائمة أثناء عملية التدريب، وانخفاض معدّل التصنيف. تعتبر الشبكات العصبونية الالتفافيةConvolutional Neural Networks (CNNs) من أكثر الخوارزميات استخداما لهذه المهمة، فقد كانت نموذجا حسابيا لتحليل البيانات الموجودة في الصور. تم اقتراح نموذج شبكة التفافية عميقة جديد لحل المشاكل المذكورة أعلاه. يهدف البحث إلى إظهار أداء نظام التّعرف باستخدام شبكاتCNNs على الذّاكرة المتاحة وزمن التدريب وذلك من خلال منهجة متغيرات مناسبة للشبكة العصبونية الالتفافية. قاعدة البيانات المستخدمة في هذا البحث هي CIFAR10 المكونة من60000 صورة ملونة تنتسب لعشرة أصناف، حيث أن كل 6000 صورة تكون لصنف من هذه الأصناف. يوجد 50000 صورة للتدريب و 10000 صورة للاختبار. حقق النموذج لدى اختباره على عينة من الصور المنتقاة من قاعدة البيانات CIFAR10 معدل تصنيف 98.87%.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا