ترغب بنشر مسار تعليمي؟ اضغط هنا

التصنيف التلقائي للهياكل الجيولوجية باستخدام الرؤية الحاسوبية ونموذج التعلم العميق

1395   1   2   0.0 ( 0 )
 نشر من قبل Tianjin ورقة بحثية
 تاريخ النشر 2018
  مجال البحث جيولوجيا
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

دراسة الهياكل الجيولوجية المكشوفة على سطح الأرض ذات أهمية كبيرة بشكل عام وخصوصا في التصميم الهندسي والبناء. في هذا البحث ، استخدمنا 2206 صورة مع 12 ملصق للتعرف على الهياكل الجيولوجية بناءً على نموذج Inception-v3. تم اعتماد الصور ذات التدرج الرمادي واللون في النموذج. كما تم بناء نموذج الشبكة العصبية التلافيفية (CNN) وتم تطبيق خوارزمية أقرب جار (KNN) والشبكة العصبية الاصطناعية (ANN) وتعزيز التدرج الشديد (XGBoost) في تصنيف الهياكل الجيولوجية بناءً على الميزات المستخرجة من مكتبة رؤية الكمبيوتر مفتوحة المصدر (OpenCV). أخيرًا ، تمت مقارنة أداء الطرق الخمس وأظهرت النتائج أن أداء KNN و ANN و XGBoost كان ضعيفًا وبدقة أقل من 40.0٪. أما CNN فعد عانت من فرط التدريب Overfitting. كان للنموذج الذي تم تدريبه باستخدام التعلم بالنقل تأثير كبير على مجموعة بيانات صغيرة من صور التركيب الجيولوجي. وأفضل نموذجين وصلوا إلى دقة 83.3٪ و 90.0٪ على التوالي. هذا يدل على أن النسيج هو السمة الرئيسية في هذا البحث. يمكن أن يستخرج التعلم القائم على نموذج التعلم العميق ميزات بيانات البنية الجيولوجية الصغيرة بشكل فعال ، وهو قوي في تصنيف صور الهيكل الجيولوجي.


ملخص البحث
تتناول هذه الورقة البحثية استخدام تقنيات التعلم العميق لتصنيف الصور الجيولوجية بشكل آلي. تم استخدام نموذج Inception-v3 لتصنيف 2206 صورة جيولوجية تحتوي على 12 تصنيفًا مختلفًا. تم مقارنة أداء هذا النموذج مع نماذج أخرى مثل KNN و ANN و XGBoost. أظهرت النتائج أن النماذج التقليدية كانت ذات أداء ضعيف، حيث كانت دقة التصنيف أقل من 40%. بينما كان نموذج CNN يعاني من مشكلة الإفراط في التدريب. من ناحية أخرى، أظهر نموذج التعلم بالنقل أداءً ممتازًا على مجموعة البيانات الصغيرة، حيث بلغت دقة التصنيف من الدرجة الأولى 83.3% ومن الدرجة الثالثة 90%. يشير هذا إلى أن النسيج هو الميزة الرئيسية في هذا البحث. يمكن لنموذج التعلم بالنقل استخراج ميزات البيانات الجيولوجية الصغيرة بفعالية، وهو قوي في تصنيف صور الهياكل الجيولوجية.
قراءة نقدية
دراسة نقدية: تعتبر هذه الورقة البحثية خطوة مهمة نحو استخدام تقنيات التعلم العميق في مجال الجيولوجيا، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، حجم البيانات المستخدمة في التدريب صغير نسبياً، مما قد يؤثر على دقة النموذج عند تطبيقه على بيانات جديدة. ثانياً، النموذج يعاني من مشكلة الإفراط في التدريب، وهو ما يشير إلى الحاجة إلى تحسين تقنيات التجميع وزيادة حجم البيانات. ثالثاً، لم يتم التطرق بشكل كافٍ إلى تأثير العوامل البيئية مثل الإضاءة والظروف الجوية على دقة التصنيف. وأخيراً، يمكن تحسين الورقة بإضافة المزيد من الدراسات المقارنة مع تقنيات أخرى في مجالات مشابهة.
أسئلة حول البحث
  1. ما هي النماذج المستخدمة في هذه الدراسة لتصنيف الصور الجيولوجية؟

    تم استخدام نماذج KNN و ANN و XGBoost و CNN ونموذج التعلم بالنقل المستند إلى Inception-v3.

  2. ما هي دقة نموذج التعلم بالنقل في تصنيف الصور الجيولوجية؟

    بلغت دقة التصنيف من الدرجة الأولى 83.3% ومن الدرجة الثالثة 90%.

  3. ما هي المشكلة الرئيسية التي واجهها نموذج CNN في هذه الدراسة؟

    نموذج CNN عانى من مشكلة الإفراط في التدريب.

  4. كيف تم تحسين أداء النموذج في هذه الدراسة؟

    تم تحسين أداء النموذج باستخدام تقنية التعلم بالنقل، والتي أظهرت فعالية في استخراج ميزات البيانات الجيولوجية الصغيرة.


المراجع المستخدمة
Fisher, M.A.; Normark, W.R.; Greene, H.G.; Lee, H.J.; Sliter, R.W. Geology and tsunamigenic potential of submarine landslides in Santa Barbara Channel, Southern California. Mar. Geol. 2005, 224, 1–22.
قيم البحث

اقرأ أيضاً

قدم الصفات مثل الثقيلة (كما هو الحال في الأمطار الغزيرة) والرياح (كما في يوم عاصف) القيم المحتملة لشدة السمات ومناخها على التوالي. لا تتحقق السمات نفسها بشكل علني وهناها هذه المنطقة الضالة. في حين يمكن استنتاج هذه السمات بسهولة من قبل البشر، فإن تصني فهم التلقائي يشكل مهمة صعبة للنماذج الحسابية. نقدم المساهمات التالية: (1) نكتسب رؤى جديدة في مهمة اختيار السمات للألمانية. وبشكل أكثر تحديدا، نطور نماذج حسابية لهذه المهمة التي يمكن أن تعميم البيانات غير المرئية. علاوة على ذلك، نوضح أن دقة التصنيف تعتمد، في جملة أمور، على درجة Polysemy في Lexemes المعنية، على إمكانات تعميم البيانات التدريبية وعلى درجة الشفافية الدلالية في أزواج صفة الأسماء المعنية. (2) نحن نقدم الموارد الأولى للتجارب الحسابية واللغوية مع أزواج الأسماء المصرفية الألمانية التي يمكن استخدامها في اختيار السمات والمهام ذات الصلة. من أجل حماية آثار الحفظ غير المرغوب فيه، نقدم طريقة تكبير البيانات التلقائي استنادا إلى مورد معجمي يمكن أن يزيد من حجم بيانات التدريب إلى حد كبير.
نحن نعتبر التمثيل الهرمي للوثائق كرسوم بيانية واستخدام التعلم العميق الهندسي لتصنيفها إلى فئات مختلفة.في حين أن الشبكات العصبية الرسم البيانية يمكن أن تتعامل مع الهيكل المتغير بشكل فعال للمستندات التسلسل الهرمية باستخدام عمليات تمرير رسالة ثابتة للصب غ، فإننا نوضح أنه يمكننا الحصول على تحسينات إضافية على الأداء باستخدام عملية تجمع الرسوم البيانية الانتقائية المقترحة التي تنشأ من حقيقة أن بعض أجزاء التسلسل الهرمي ثابتةعبر وثائق مختلفة.طبقنا نموذجنا لتصنيف بروتوكولات التجريبية السريري (CT) إلى فئات كاملة وإنهاءها.نستخدم حقيبة من الكلمات القائمة على الأكياس، بالإضافة إلى تضيير مقرها المحولات مسبقا لفصل العقد الرسم البياني، وتحقيق F1 Squareesaround 0.85 على سجل CT واسع النطاق للجمهور حول بروتوكولات 360k.نوضح كذلك كيف يمكن للتجمع الانتقائي إضافة رؤى في التنبؤ بحالة إنهاء CT.نحن نجعل التعليمات البرمجية المصدرية والشقاقات DataSet يمكن الوصول إليها.
بصرف النظر عن نجاح نهج تعلم النطاق المختلط في مجال التعلم العميق لحل المهام المختلفة لمعالجة اللغة الطبيعية، فإنه لا يقرض حل جماعيا للكشف عن المعلومات الخاطئة من بيانات وسائل التواصل الاجتماعي CovID-19. نظرا للتعقيد المتأصل من هذا النوع من البيانات، الناجمة عن ديناميك (سياقه يتطور بسرعة)، ذات الطابع الدقيق (أنواع الخائن غير غامضة في كثير من الأحيان)، ومتنوعة (الفئات المنحيحة، المحبوسة والتداخل) الطبيعة، من الضروري نموذج فعال لالتقاط كل من السياق المحلي والعالمي للمجال المستهدف. من خلال إجراء تحقيق منهجي، نظهر أن: (1) النماذج المدربة مسبقا مسبقا للمحولات العميقة، المستخدمة عبر تعلم نقل المجال المختلط، جيدة فقط في التقاط السياق المحلي، وبالتالي تظهر تعميم ضعيف، و (2) يمكن أن يستخرج مزيج من النماذج الضحلة المستندة إلى الشبكة والشبكات العصبية التنافسية السياق محليا بالإضافة إلى السياق بشكل فعال بالإضافة إلى البيانات المستهدفة بطريقة هرمية بطريقة هرمية، مما يتيح من تقديم حل أكثر تعميما.
مكنت نماذج اللغة العصبية العميقة مثل بيرت التطورات الأخيرة في العديد من مهام معالجة اللغة الطبيعية. ومع ذلك، نظرا للجهد والتكلفة الحاسوبية المشاركة في التدريب المسبق لها، يتم إدخال هذه النماذج عادة فقط لعدد صغير من لغات الموارد عالية الوزن مثل اللغة الإنجليزية. في حين تتوفر نماذج متعددة اللغات التي تغطي أعدادا كبيرة من اللغات، فإن العمل الحديث يشير إلى أن التدريب أحادي الأحادي يمكن أن ينتج عن نماذج أفضل، وفهمنا للمفاضرة بين التدريب الأحادي وغير اللغوي غير مكتمل. في هذه الورقة، نقدم خط أنابيب بسيطة وأتمتة بالكامل لإنشاء نماذج بيرت الخاصة باللغة من البيانات من بيانات ويكيبيديا وإدخال 42 من هذه النماذج الجديدة، والأكثر من اللازم لغات حتى الآن تفتقر إلى نماذج اللغة العصبية العميقة المخصصة. نقوم بتقييم مزايا هذه النماذج باستخدام اختبارات Cloze و Autify Parser على بيانات التبعيات العالمية، والأداء المتناقض مع النتائج باستخدام طراز Bert (Mbert) متعدد اللغات. نجد أن نماذج WikiBert المقدمة حديثا تفوقت Mbert في اختبارات Cloze لجميع اللغات تقريبا، وأن uDify باستخدام نماذج Wikibert تفوق المحلل باستخدام Mbert في المتوسط، مع توضح الطرز الخاصة باللغة تحسين أداء محسنة بشكل كبير لبعض اللغات، ولكن تحسين محدود أو تحسين انخفاض في الأداء للآخرين. تتوفر جميع الطرق والنماذج المقدمة في هذا العمل تحت التراخيص المفتوحة من https://github.com/turkunlp/wikibert.
تقنيات التحييد، على سبيل المثالإن رفض المسؤولية والحرمان من الضحية، يتم استخدامه في سرد شكوك تغير المناخ لتبرير عدم العمل أو تعزيز وجهة نظر بديلة.نسترحب أولا بالعلوم الاجتماعية لإدخال المشكلة في مجتمع NLP، وتقديم حبيبتي مخطط الترميز، ثم جمع التعليقات التوضيحية اليدوية من التقنيات المحايدة في النص فيما يتعلق بتغير المناخ، وتجربة النماذج القائمة على برت تحت إشراف وشبه الإشرافوبعد

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا