Do you want to publish a course? Click here

Referential Study of the Concept of Visual Saliency and Its Role in Object Detection in Digital Images

دراسة مرجعية لمفهوم البروز البصري و دوره في اكتشاف الأغراض في الصور الرقمية

2732   2   34   0 ( 0 )
 Publication date 2017
and research's language is العربية
 Created by Shamra Editor




Ask ChatGPT about the research

In this research, we define the concept of visual saliency in biology and how it is described in computer science using the concept of saliency maps, and how to use these maps to detect salient objects in digital images. We also conduct experiments using several algorithms to detect salient objects, and describe how to quantify the quality of the results using clear and well-defined standards.


Artificial intelligence review:
Research summary
تتناول هذه الدراسة مفهوم البروز البصري ودوره في اكتشاف الأغراض في الصور الرقمية. يعتبر اكتشاف الأغراض في الصور الرقمية من أقدم المجالات البحثية في علوم الحاسب، وقد تطورت الأساليب المستخدمة فيه من تقنيات التقطيع إلى الشبكات العصبونية. يهدف مفهوم البروز البصري إلى محاكاة كيفية معالجة الدماغ البشري للمعلومات البصرية، حيث يركز على تحديد الأجزاء الأكثر أهمية في الصورة. تم في هذا البحث تعريف البروز البصري من الناحية البيولوجية وكيفية توصيفه في علوم الحاسب باستخدام خرائط البروز. كما تم إجراء تجارب باستخدام خوارزميات مختلفة لتوليد خرائط البروز وتقييم جودتها ودقتها. تم تقسيم البحث إلى عدة فقرات تتناول مفهوم البروز البيولوجي، خرائط البروز وأنواعها، طرق استخراج الأغراض من الصور، ونتائج تطبيق الخوارزميات على مجموعات مختلفة من الصور. أظهرت النتائج أن خوارزمية GMR تحقق أفضل دقة مقارنة ببقية الخوارزميات، بينما خوارزمية FASA تتميز بسرعة التنفيذ.
Critical review
دراسة نقدية: على الرغم من أن البحث يقدم نظرة شاملة ومفصلة حول مفهوم البروز البصري واستخداماته في اكتشاف الأغراض في الصور الرقمية، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، كان من الممكن تقديم مقارنة أوسع بين الخوارزميات المختلفة باستخدام مجموعات بيانات متنوعة أكثر لتعزيز النتائج. ثانياً، لم يتم التطرق بشكل كافٍ إلى التحديات والمشاكل التي قد تواجه تطبيق هذه الخوارزميات في بيئات حقيقية. وأخيراً، كان من الممكن تقديم توصيات أكثر وضوحاً حول كيفية تحسين الخوارزميات الحالية أو تطوير خوارزميات جديدة بناءً على النتائج المستخلصة.
Questions related to the research
  1. ما هو الهدف الأساسي من استخدام مفهوم البروز البصري في معالجة الصور الرقمية؟

    الهدف الأساسي هو تحديد الأجزاء الأكثر أهمية في الصورة، حيث يركز الدماغ البشري على معالجة هذه الأجزاء بدلاً من معالجة الصورة بالكامل، مما يساعد في اكتشاف الأغراض البارزة بشكل أكثر فعالية.

  2. ما هي خرائط البروز وكيف تُستخدم في اكتشاف الأغراض؟

    خرائط البروز هي خرائط طبوغرافية تمثل البروز البصري للمشهد البصري. تُستخدم هذه الخرائط لتحديد القطاعات البارزة في الصورة، مما يساعد في اكتشاف الأغراض البارزة من خلال تحويل الصورة إلى خريطة تدرج رمادي ثم إلى صورة ثنائية.

  3. ما هي الخوارزمية التي حققت أفضل دقة في اكتشاف الأغراض وفقاً للدراسة؟

    خوارزمية GMR (Graph-Based Manifold Ranking) حققت أفضل دقة مقارنة ببقية الخوارزميات التي تم اختبارها في الدراسة.

  4. ما هي التحديات التي قد تواجه تطبيق هذه الخوارزميات في بيئات حقيقية؟

    من التحديات التي قد تواجه تطبيق هذه الخوارزميات في بيئات حقيقية هي التعامل مع الصور ذات الخلفيات المعقدة، والتباين المنخفض بين الأغراض والخلفية، وكذلك الحاجة إلى تحسين سرعة التنفيذ لتكون مناسبة للتطبيقات الزمنية الحقيقية.


References used
Achanta R. , Hemami S. , Estrada F. , Susstrunk S., 2009, Frequencytuned salient region detection,2009 IEEE Conference on Computer Vision and Pattern Recognition, No. Ic, P.P. 1597–1604
Arya R. , Singh N. , Agrawal R.K., 2016, A novel hybrid approach for salient object detection using local and global saliency in frequency domain,Multimedia Tools and Applications, Vol. 75,No. 14, P.P. 8267–8287
Borji A. , Cheng M.-M. , Jiang H. , Li J., 2015, Salient Object Detection: A Benchmark,IEEE Transactions on Image Processing, Vol. 24,No. 12, P.P. 5706–5722
rate research

Read More

Empathy is a complex multidimensional concept, which has an emotive, moral, cognitive and behavioural component. clinical empathy involves an ability to: (A) understand the patient’s situation, feelings, and Perspective; (B) communicate that understanding to patient accurately; (C) act on that understanding with the patient effectively way.
Reconstruction of mandibular defects after trauma or tumor resection is one of the most challenging problems facing by maxillofacial surgeons. Few mandibular defects require not just a fixation of an implant, but the reconstruction of the entire ma ndible. The aim of this study was to design a mandibular prosthesis for a mandibular cancer patient and study its efficacy by stress–strain related mechanical property using finite element analysis (FEA).
Background& Objective: The reduction of alveolar crestal bone density is one of the earlier signs of periimplant disease and precedes the loss of height of the alveolar crest, because of that early detection of the small changes in density is impor tant and lead to the early onset of treatment and increases its success's percentage. This study aimed to evaluate the ability of the direct conventional digital method in detection of density changes around dental implants by the mean value of the gray level of the histogram of the selected area comparing with radiographic subtraction method.
Cervix cancer is one of the most important gynecological cancers ,which is possible to be reduced by using early precancerous detecting technics . Objective : The aim of the study is to highlighten the colposcopy as a device for early detection o f precancerous lesions in the cervix , and compare the results with histopathology .
Multimodal named entity recognition (MNER) requires to bridge the gap between language understanding and visual context. While many multimodal neural techniques have been proposed to incorporate images into the MNER task, the model's ability to lever age multimodal interactions remains poorly understood. In this work, we conduct in-depth analyses of existing multimodal fusion techniques from different perspectives and describe the scenarios where adding information from the image does not always boost performance. We also study the use of captions as a way to enrich the context for MNER. Experiments on three datasets from popular social platforms expose the bottleneck of existing multimodal models and the situations where using captions is beneficial.
comments
Fetching comments Fetching comments
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا