Do you want to publish a course? Click here

Automatic Estimation of 3D Human Pose and Shape from a Single Image

تقدير تلقائي لوضع الشخص ثلاثي البعد من خلال صورته ثنائية البعد

1554   0   10   0 ( 0 )
 Publication date 2018
and research's language is العربية
 Created by Ghaith Abu Hakmeh




Ask ChatGPT about the research

No English abstract


Artificial intelligence review:
Research summary
تتناول هذه الورقة البحثية مشكلة تقدير الوضع ثلاثي الأبعاد لجسم الإنسان من صورة ثنائية الأبعاد واحدة، وهي مشكلة تمثل تحديًا كبيرًا في مجال الرؤية الحاسوبية. تعرض الورقة كيفية التعامل مع هذه المشكلة عبر العقود الماضية وتستعرض التطورات الحديثة في هذا المجال. كما تناقش الورقة الاتجاهات المحتملة للبحث في المستقبل. تتناول الورقة أيضًا كيفية تمثيل الحركة البشرية باستخدام الوضعيات ثلاثية الأبعاد بدلاً من الخصائص منخفضة المستوى، مما يجعلها أكثر قابلية للتطبيق وأصغر حجمًا. تستعرض الورقة العديد من التقنيات المستخدمة في تقدير الوضعيات ثلاثية الأبعاد، مثل البنية من الحركة، الأنظمة الصوتية متعددة المقاييس، ومستشعرات العمق، وتوضح القيود التي تواجهها هذه التقنيات في بعض السيناريوهات. كما تقدم الورقة مقارنة بين الأعمال المشابهة وتستعرض الطرق المختلفة لإزالة الغموض وتحسين كفاءة الخوارزميات. تعتمد الورقة على نموذج SMPLify الذي يستخدم نموذجًا إحصائيًا ثلاثي الأبعاد لأجسام الإنسان، يتم تدريبه على آلاف الأجسام الممسوحة ثلاثيًا. يتم استخدام شبكة عصبية تلافيفية (CNN) للتنبؤ بالمواقع المشتركة في صورة المفاصل ثنائية الأبعاد، ثم يتم ملائمة نموذج ثلاثي الأبعاد للجسم بحيث تقلل المفاصل المتوقعة للنموذج من مدة الخطأ المرجحة القوية. تقدم الورقة أيضًا نموذج SCAPE الذي يستخدم نموذجًا محدود الأبعاد ولكنه مفصل من الشكل والتشوهات المعتمدة على الحالة، والذي يتم استخلاصه من قاعدة بيانات لفحص الأجسام البشرية. يتم تقدير الشكل ثلاثي الأبعاد المفصل ووضع الجسم بشكل مباشر من بيانات الصور باستخدام خوارزمية تحسين تعتمد على البحث العشوائي.
Critical review
دراسة نقدية: تقدم الورقة البحثية نظرة شاملة ومفصلة حول مشكلة تقدير الوضع ثلاثي الأبعاد لجسم الإنسان من صورة ثنائية الأبعاد واحدة، وتستعرض العديد من التقنيات والنماذج المستخدمة في هذا المجال. ومع ذلك، يمكن أن تكون الورقة أكثر وضوحًا في بعض الأجزاء، حيث أن التفاصيل التقنية المعقدة قد تكون صعبة الفهم للقارئ غير المتخصص. بالإضافة إلى ذلك، يمكن أن تكون الورقة أكثر تفاعلية من خلال تقديم أمثلة تطبيقية توضح كيفية استخدام النماذج والخوارزميات في سيناريوهات حقيقية. كما أن الورقة تعتمد بشكل كبير على النماذج الإحصائية والشبكات العصبية التلافيفية، مما قد يتطلب موارد حوسبة كبيرة، وهو ما يمكن أن يكون عائقًا في بعض التطبيقات العملية. ومع ذلك، فإن الورقة تقدم مساهمة قيمة في مجال الرؤية الحاسوبية وتفتح آفاقًا جديدة للبحث والتطوير في هذا المجال.
Questions related to the research
  1. ما هي المشكلة الرئيسية التي تتناولها الورقة البحثية؟

    المشكلة الرئيسية هي تقدير الوضع ثلاثي الأبعاد لجسم الإنسان من صورة ثنائية الأبعاد واحدة.

  2. ما هي التقنيات الرئيسية المستخدمة في تقدير الوضع ثلاثي الأبعاد؟

    التقنيات الرئيسية تشمل البنية من الحركة، الأنظمة الصوتية متعددة المقاييس، ومستشعرات العمق، بالإضافة إلى النماذج الإحصائية والشبكات العصبية التلافيفية.

  3. ما هو نموذج SMPLify وكيف يتم استخدامه؟

    نموذج SMPLify هو نموذج إحصائي ثلاثي الأبعاد لأجسام الإنسان، يتم تدريبه على آلاف الأجسام الممسوحة ثلاثيًا. يتم استخدام شبكة عصبية تلافيفية (CNN) للتنبؤ بالمواقع المشتركة في صورة المفاصل ثنائية الأبعاد، ثم يتم ملائمة نموذج ثلاثي الأبعاد للجسم بحيث تقلل المفاصل المتوقعة للنموذج من مدة الخطأ المرجحة القوية.

  4. ما هي الفوائد الرئيسية لاستخدام نموذج SCAPE؟

    نموذج SCAPE يتميز بقدرته على تمثيل التشوهات غير الصلبة لجسم الإنسان ويجسد التباين في شكل الجسم بين الأشخاص المختلفين. يتم تعلم النموذج من الأمثلة، مما يمكنه من التقاط مجموعة غنية وطبيعية من أشكال الأجسام ويوفر نموذج شبكي مثلثي ثلاثي الأبعاد أكثر تفصيلاً لجسم الإنسان.


References used
Y. Xiang and S. Savarese, “Estimating the aspect layout of object categories,” in International Conference on Computer Vision and Pattern Recognition, 2012.
M. Aubry, D. Maturana, A. Efros, B. Russell, and J. Sivic, “Seeing 3d chairs: exemplar part-based 2d-3d alignment using a large dataset of cad models,” in IEEE Conference on Computer Vision and Pattern Recognition, 2014.
S. Fidler, S. Dickinson, and R. Urtasun, “3d object detection and viewpoint estimation with a deformable 3d cuboid model,” in Advances in Neural Information Processing Systems, 2012.
E. Simo-Serra, A. Quattoni, C. Torras, and F. Moreno-Noguer, “A joint model for 2d and 3d pose estimation from a single image,” in IEEE Conference on Computer Vision and Pattern Recognition, 2013.
Lee, H., Chen, Z.: Determination of 3D human body postures from a single view. Computer Vision Graphics and Image Processing 30(2), 148{168 (1985)
Taylor, C.: Reconstruction of articulated objects from point correspondences in single uncalibrated image. Computer Vision and Image Understanding, CVIU 80(10),349{363 (2000)
Barron, C., Kakadiaris, I.: Estimating anthropometry and pose from a single uncalibrated image. Computer Vision and Image Understanding, CVIU 81(3), 269{284(2001)
Parameswaran, V., Chellappa, R.: View independent human body pose estimation from a single perspective image. In: IEEE Conference on Computer Vision and Pattern Recognition, CVPR. pp. 16{22 (2004)
Keep it SMPL: Automatic Estimation of 3D Human Pose and Shape from a Single Image
rate research

Read More

There has been a clear and rapid development in signal processing systems, this development comes as a result of the availability of modern techniques in electronic systems and also as a result of achieving mathematical algorithms which were effec tive and perfect for signal processing. One of the most important application in signal processing is the digital image processing techniques. Sampling process is regarded as one of the basic and important operations in signal processing, from which we obtain samples that can represent the original image in perfect way. We present in this essay an affective algorithm which helps to arrange onedimensional samples from two- dimensional samples image. This enables to obtain a series of samples which has an ability of representing images with concern of their general structure. Also the neighborhood correlation of image points is respected, in addition to carrying out the subsequent treatments with less mathematical cost.
Fetus images produced by 2D ultrasound devices are ambiguous and lack precision. This led to the need for offering a 3D visualization of the fetus, which allows visualizing width, height, and angle, in order to get additional information about the fetus, and detect fetus abnormalities. We explain in this paper our method in producing 3D models of the fetus from 2D images using a computer system without the need for changing the 2D imaging devices, and without using position sensors. Our method is based on passing the probe over the pregnant woman's abdomen and make a manual scan for the entire body of the fetus from top of the head till the bottom of his feet, then it saves this scan as a video clip then send, it to the computer which segments the video into multiple images which are saved and later processed using digital processing principles of images. Then these processed images are reconstructed to produce the volume matrix and then display it in a 3D form using 3D model construction methods. We applied our software on various fetuses of different ages and got volume images which are considered good in comparison with the images offered by currently available systems and devices. The precision of the images we got, differs according to the change in fetus pose, amniotic liquid, and fetus size, The obstetrician or gynecologist can retrieve more precise details by changing the angle and displaying volume images of certain part of the fetus body.
As oil spells, it is important to act as quickly as possible in order to minimize damages that can affect people and natural life. Thus, for the necessary operations to be done on time following an accident, numerical simulation of oil spell is an essential tool. The purpose of this paper is to develop a 2-D numerical model for the main operations that control and affect the trajectory and fate of an oil spill. Two additional operations had been considered, those are evaporation and dissolution which lead to lose some of the spilled oil even in air or water column. Afterwards, oil spill scenarios had been created and spreading of an oil spill, whose density and initial position are known, had been examined. Using MATLAB, flow simulations had been made and results had been discussed.
Image compression is one of the most important branches of digital image processing. It reduces the size of the captured images and minimizes the storage space on the drivers to speed up the transferring and transmission. In this paper we will pre sent a new approach for compressing stereo images based on three algorithms; the first one is comparing the two images that perform the stereoscopic view by noticing the great similarities between them and encoding the difference between the two images instead of encoding the whole image. The second one is reducing the redundancy between the Pixels using a 2D Digital Curvelet Transformation so we can utilize the great ability to represent the curves in the image with minimum number of coefficients. Then quantize them and remove undesirable coefficient. The low number of coefficient contains most of image data. Last one is using Huffman Encoding and take advantage of the lossless property so we can encode image and reduce the size of data without getting any image distortion or lose any part of this image. The performance of the proposed algorithm evaluated using Compression Ratio standard which is the number of the image bits after compression to the number of the original image bits before compression. Also, Peak Signal to Noise Ratio standard (PSNR) which represent the similarity between the restored image and the original image. In final, the Mean Square Error standard (MSE) which represent the error between the restored image and original image. In conclusion, the main objective here is to get the lowest rate for image compression ratio with the highest value for the image quality PSNR at the lowest value of the errors MSE.
Stereoscopic broadcast Tv systems,That is,Those capable of reproducing a Three-dimensional picture,give a better idea about The televised scene,enhance artistic impression,and make The reproduction more realistic so That The observer has The sensatio n of being actually present at The scene of action. For a compatible 2-d/3-d colour Tv system The channel bandwidth should be twice That of The standard broadcast Tv channel. The search for ways and means of reducing The required bandwidth without an impairment in The quality of The colour 3-d picture is a major direction in work or such systems.
comments
Fetching comments Fetching comments
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا