ترغب بنشر مسار تعليمي؟ اضغط هنا

استرجاع الصور بالاعتماد على المحتوى

Content based image retrieval cbir

5811   10   227   0 ( 0 )
 تاريخ النشر 2013
  مجال البحث هندسة برمجيات
والبحث باللغة العربية
 تمت اﻹضافة من قبل Zein Shaheen




اسأل ChatGPT حول البحث

هدفنا من خلال هذه الدراسة في إطار المشروع الفصلي للسنة الرابعة إلى إلقاء الضوء على استرجاع الصور من مجموعة كبيرة بالاعتماد على محتوى صورة هدف , و قمنا بتدعيم هذه الدراسة بتطبيق ضمن بيئة الماتلاب لبرنامج بحث عن الصور المشابهة لصورة مدخلة . و قد تركز بحثنا على ميزتين هامتين يكاد لا يخلو منها أي نظام بحث عن الصور بالاعتماد على المحتوى و هما ميزتي الهيستوغرام اللوني و بنية الصورة texture , ووضحنا الخطوات التي يتم في ضوئها عملية الاسترجاع بدءاً من تحليل الصورة و استخلاص شعاع الواصفات الخاص فيها , و مطابقته مع أشعة الميزات الخاصة بالصور الموجودة في قاعدة البيانات ليتم ترتيب الصور بحسب مدى تشابهها من الصورة الهدف . و تطرقت الدراسة إلى استخدام الفضاء اللوني HMMD كبديل للفضاء اللوني RGB لاستخراج واصفات البنية اللونية على اعتبار أنه نموذج لوني موجه بالمستخدم user oriented و بالتالي نضمن أن نحصل على نتائج أفضل ترضي المستخدم . وقمنا بتدعيم الدراسة بعدد من الأشكال و الأمثلة و المخططات التي توضح محتوى الدراسة النظرية و ما قمنا بعمله في التطبيق ضمن بيئة الماتلاب .


ملخص البحث
تهدف هذه الدراسة إلى تسليط الضوء على استرجاع الصور من مجموعة كبيرة بالاعتماد على محتوى صورة الهدف، وتم تدعيمها بتطبيق ضمن بيئة الماتلاب لبرنامج بحث عن الصور المشابهة لصورة مدخلة. ركز البحث على ميزتين هامتين هما الهيستوغرام اللوني وميزات البنية (texture)، وتم توضيح خطوات عملية الاسترجاع بدءاً من تحليل الصورة واستخلاص شعاع الواصفات الخاص بها، ومطابقته مع أشعة الميزات الخاصة بالصور الموجودة في قاعدة البيانات لترتيب الصور بحسب مدى تشابهها مع الصورة الهدف. كما تطرقت الدراسة إلى استخدام الفضاء اللوني HMMD كبديل للفضاء اللوني RGB لاستخراج واصفات البنية اللونية، مما يضمن نتائج أفضل ترضي المستخدم. تم تدعيم الدراسة بعدد من الأشكال والأمثلة والمخططات التي توضح محتوى الدراسة النظرية وما تم عمله في التطبيق ضمن بيئة الماتلاب.
قراءة نقدية
دراسة نقدية: على الرغم من أن الدراسة تقدم نظرة شاملة ومفصلة حول استرجاع الصور اعتماداً على المحتوى، إلا أنها تفتقر إلى بعض النقاط الهامة. أولاً، لم يتم التطرق بشكل كافٍ إلى التحديات العملية التي قد تواجه تطبيق النظام في بيئات حقيقية. ثانياً، كان من الممكن تقديم مقارنة بين أداء الفضاء اللوني HMMD والفضاءات اللونية الأخرى بشكل أكثر تفصيلاً. ثالثاً، الدراسة تركز بشكل كبير على الجانب النظري والتطبيقي داخل بيئة الماتلاب، ولكنها لم تقدم حلولاً عملية لتطبيق النظام في بيئات برمجية أخرى مثل جافا أو تطبيقات الموبايل. أخيراً، كان من الممكن تضمين تجارب عملية واختبارات أداء للنظام المقترح لتقديم دليل عملي على فعاليته وكفاءته.
أسئلة حول البحث
  1. ما هي الميزات الأساسية التي تم التركيز عليها في الدراسة لاسترجاع الصور؟

    تم التركيز على ميزتين أساسيتين هما الهيستوغرام اللوني وميزات البنية (texture).

  2. ما هو الفضاء اللوني الذي تم اقتراحه كبديل للفضاء اللوني RGB؟

    تم اقتراح الفضاء اللوني HMMD كبديل للفضاء اللوني RGB.

  3. ما هي البيئة البرمجية التي تم استخدامها لتطبيق نظام استرجاع الصور في الدراسة؟

    تم استخدام بيئة الماتلاب لتطبيق نظام استرجاع الصور في الدراسة.

  4. ما هي التحديات التي واجهت الباحثين في الحصول على المراجع والمعلومات اللازمة للدراسة؟

    واجه الباحثون تحديات تتعلق بالحظر المفروض من قبل الشركات الغربية على المواطن السوري في الدخول إلى العديد من المواقع التي يتم فيها تشارك المعرفة، بالإضافة إلى عدم القدرة على الدخول إلى المكتبات العالمية على الإنترنت بسبب عدم مجانية الحصول على الملفات المتاحة.


المراجع المستخدمة
John Eakins and Margaret Graham (1999) , "Content-based Image Retrieval" , University of Northumbria at Newcastle
Li, Ze-Nian, and Mark S. Drew. Fundamentals of multimedia, ISBN: 0130618721. Vol. 7458. Pearson Education, Inc., Upper Saddle River, NJ, 2004
Howarth, Peter, and Stefan Rüger. "Evaluation of texture features for content-based image retrieval." Image and Video Retrieval. Springer Berlin Heidelberg, 2004. 326-334
Kim, Hyeon Jun, and Jin Soo Lee. "HMMD color space and method for quantizing color using HMMD space and color spreading." U.S. Patent No. 6,633,407. 14 Oct. 2003
Huang, Yin-Fu, and He-Wen Chen. "A multi-type indexing CBVR system constructed with MPEG-7 visual features." Active Media Technology. Springer Berlin Heidelberg, 2011. 71-82
Ventura Royo, Carles. "Image-Based Query by Example Using MPEG-7 Visual Descriptors."
قيم البحث

اقرأ أيضاً

تعد أنظمة استرجاع الصور الطبية اعتماداً على المحتوى من التقنيات الحديثة التي يسعى الباحثون إلى تكاملها مع أنظمة التشخيص بمساعدة الحاسوب. تقوم هذه الأنظمة أساساً بإيجاد صور في قاعدة بيانات تضم مجموعة كبيرة من الصور ذات محتوى مشابه لصورة استعلام معينة. يجري الاستعلام عن طريق استخلاص الخصائص البصرية للصورة المعينة و صياغتها في متجه خصائص تَُقارن مكوناته بمتجهات الخصائص للصور الموجودة في قاعدة البيانات و يقاس التشابه، و من ثم تسَترجع الصور التي لها محتوى مشابه لصورة الاستعلام. تقدم هذه الورقة تقييماً للوضع الراهن لأنظمة استرجاع الصور الطبية اعتماداً على المحتوى بناء على دراسة تحليلية للبحوث الحديثة المنشورة، و تخلص إلى استنتاج اتجاهات بحثية محددة في هذا المجال.
يصف هذا البحث نظاما للتعرف على الكلمة العربية المكتوبة بخط اليد دون تقطيع سابق للكلمة إلى محارف, و سيتم التعرف من خلاله على مستويين, و قد طور هذا النظام اعتمادا على نظام التعرف الضوئي على الحروف, و خوارزمية ماركوف المخفية, و عدد من التوابع (المورفولو جية), و خوارزميات استرجاع الصور اعتمادا على المحتوى.
من المتوقع أن تحتوي أنظمة التسمية على الصور القدرة على الجمع بين المفاهيم الفردية عند وصف المشاهد مع مجموعات المفاهيم التي لم يتم ملاحظتها أثناء التدريب. على الرغم من التقدم الكبير في تقسيم الصور بمساعدة إطار الجيل التلقائي التلقائي، تفشل النهج الحال ية في التعميم بشكل جيد إلى مجموعات مفهوم جديدة. نقترح إطارا جديدا يدور حول التحقيق في العديد من مثيلات تدريب التسمية التوضيحية في الصورة المماثلة (استرجاع)، وأداء المناسبات التناظرية على الكيانات ذات الصلة في النماذج الأولية المستردة (القياس)، وتعزيز عملية التوليد بنتائج المنطق (التكوين). تعزز طريقةنا نموذج الجيل عن طريق الإشارة إلى الحالات المجاورة في التدريب المحدد لإنتاج مجموعات مفهوم جديدة في التسميات التوضيحية المولدة. نقوم بإجراء تجارب على معايير تقسيم الصور المستخدمة على نطاق واسع. تحقق النماذج المقترحة تحسنا كبيرا على أساس الأساس المقارنة على كل من مقاييس التقييم المرتبطة بالتكوين ومقاييس تقسيم الصور التقليدية.
تم بناء نظام استرجاع لصور الطرح الرقمي للأوعية الدموية الدماغية ثنائية الأبعاد اعتماداً على المحتوى. يقوم النظام بإيجاد صور في قاعدة بيانات لصور الطرح الرقمي للأوعية الدموية الدماغية (حالة أمهات الدم الكيسية) ذات محتوى مشابه لصورة استعلام معينة و است رجاعها. تمت عملية الاستعلام عن طريق استخلاص خصائص الشكل البصرية لأمهات الدم في صورة الاستعلام و صياغتها في متجه خصائص و مقارنة مكوناته مع متجهات خصائص الشكل لأمهات الدم في صور الطرح الرقمي للأوعية الدموية الموجودة في قاعدة البيانات. تم قياس التشابه باستخدام المسافة الاقليدية، و من ثم استرجاع الصور التي لها محتوى مشابها لصورة الاستعلام. تم حساب الدقة بإيجاد نسبة مساحة أم الدم في الصور المسترجعة الأولى إلى مساحة أم الدم في صورة الاستعلام لثمان حالات استعلام تم تنفيذها، بلغت قيمة متوسط الدقة 98%، تبين النتائج أنَّه يمكن استخدام النظام المنفذ لاسترجاع الصور اعتماداً على المحتوى لإيجاد المساحة غير المعلومة لأم الدم من قاعدة بيانات لصور أمهات الدم تكون فيها مساحة أم الدم فيها معلومة.
تم اعتماد اهتمام الذات مؤخرا لمجموعة واسعة من مشاكل النمذجة التسلسلية. على الرغم من فعاليته، فإن اهتمام الذات يعاني من حساب التربيعي ومتطلبات الذاكرة فيما يتعلق بطول التسلسل. تركز النهج الناجحة للحد من هذا التعقيد على حضور النوافذ المنزلق المحلية أو مجموعة صغيرة من المواقع مستقلة عن المحتوى. يقترح عملنا تعلم أنماط الانتباه ديناميكية متناثرة تتجنب تخصيص الحساب والذاكرة لحضور المحتوى غير المرتبط باستعلام الفائدة. يبني هذا العمل على سطرين من الأبحاث: فهو يجمع بين مرونة النمذجة للعمل المسبق على اهتمام متمرد للمحتوى مع مكاسب الكفاءة من الأساليب القائمة على الاهتمام المحلي والزموني المتناثر. نموذجنا، محول التوجيه، ينفذ عن النفس مع وحدة توجيه متناثرة تعتمد على الوسائل K عبر الإنترنت مع تقليل التعقيد العام للانتباه إلى O (N1.5D) من O (N2D) لطول التسلسل N وبعد المخفي D. نظرا لأن نموذجنا يتفوق على نماذج انتباه متناثرة قابلة للمقارنة على نمذجة اللغة على Wikitext-103 (15.8 مقابل 18.3 حيرة)، وكذلك على جيل الصورة على Imagenet-64 (3.43 مقابل 3.44 بت / خافت) أثناء استخدام طبقات أقل من الاهتمام الذاتي. بالإضافة إلى ذلك، وضعنا مجموعة جديدة من مجموعة جديدة من مجموعة بيانات PG-19 التي تم إصدارها حديثا، والحصول على اختبار حيرة من 33.2 مع نموذج محول توجيه 22 طبقة مدرب على تسلسل الطول 8192. نحن نفتح المصدر لتحويل التوجيه في Tensorflow.1
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا