يعتبر ضغط الصور أحد أهم فروع معالجة الصورة الرقمية حيث يُعنى بتقليل حجم الصور الملتقطة لتوفير المساحة المخصصة لها على أقراص التخزين و تسهيل عملية نقلها و إرسالها.
يُقدِّم هذا البحث طريقة جديدة لضغط الصور المجسمة بالاعتماد على ثلاثة خوارزميات أولها المقارنة بين الصورتين المشكلتين للمنظر المجسم و الاستفادة من خاصية التشابه الكبير بينهما و ترميز الفرق بين الصورتين عوضاً عن ترميز الصورة بشكل كامل، و ثانيها بتقليل الفائض بين عناصر الصورة (Pixels) باستخدام التحويل الانحنائي الرقمي ثنائي البعد حيث نستفيد من قدرة هذا التحويل الكبيرة على تمثيل الانحناءات داخل الصورة بأقل عدد من المعاملات ليتم تكميتها و إزالة المعاملات غير المرغوبة و الحصول على عدد قليل من المعاملات الحاوية على أغلب تفاصيل الصورة، و آخرها باستخدام ترميز هوفمان و الاستفادة من خاصية عدم الفقد التي يتميز بها حيث يمكن ترميز الصورة و تقليل حجم بياناتها دون أن يحصل أي تشويه بالصورة أو فقدان أي جزء من هذه الصورة.
كما يتم تقييم أداء خوارزمية البحث المقترح باستخدام معيار نسبة ضغط الصورة (Compression Ratio) أي نسبة عدد البتات الممثلة للصورة بعد الضغط إلى عدد البتات الممثلة للصورة الأصلية قبل الضغط، و كذلك معيار جودة الصورة (PSNR) أي مدى تشابه الصورة المستعادة مع الصورة الأصلية، و معيار متوسط مربعات الأخطاء (MSE) أي مقدار الخطأ في الصورة المستعادة، حيث ينبغي الحصول على أقل قيمة لنسبة ضغط الصور مع أعلى قيمة لجودة الصورة بأقل قيمة للأخطاء.
Image compression is one of the most important branches of digital image
processing. It reduces the size of the captured images and minimizes the storage space on
the drivers to speed up the transferring and transmission.
In this paper we will present a new approach for compressing stereo images based on
three algorithms; the first one is comparing the two images that perform the stereoscopic
view by noticing the great similarities between them and encoding the difference between
the two images instead of encoding the whole image. The second one is reducing the
redundancy between the Pixels using a 2D Digital Curvelet Transformation so we can
utilize the great ability to represent the curves in the image with minimum number of
coefficients. Then quantize them and remove undesirable coefficient. The low number of
coefficient contains most of image data. Last one is using Huffman Encoding and take
advantage of the lossless property so we can encode image and reduce the size of data
without getting any image distortion or lose any part of this image.
The performance of the proposed algorithm evaluated using Compression Ratio
standard which is the number of the image bits after compression to the number of the
original image bits before compression. Also, Peak Signal to Noise Ratio standard (PSNR)
which represent the similarity between the restored image and the original image. In final,
the Mean Square Error standard (MSE) which represent the error between the restored
image and original image.
In conclusion, the main objective here is to get the lowest rate for image compression
ratio with the highest value for the image quality PSNR at the lowest value of the errors
MSE.
Artificial intelligence review:
Research summary
يهدف هذا البحث إلى تقديم طريقة جديدة لضغط الصور المجسمة باستخدام تقدير الفرق بين الصورتين والتحويل الانحنائي الرقمي ثنائي البعد. تعتمد الطريقة على ثلاث خوارزميات: الأولى تقارن بين الصورتين المكونتين للمنظر المجسم وتقوم بترميز الفرق بينهما بدلاً من ترميز الصورة بالكامل، الثانية تستخدم التحويل الانحنائي الرقمي لتقليل الفائض بين عناصر الصورة، والثالثة تستخدم ترميز هوفمان لضغط البيانات بدون فقد. يتم تقييم أداء الخوارزمية المقترحة باستخدام معايير نسبة ضغط الصورة (Compression Ratio)، جودة الصورة (PSNR)، ومتوسط مربعات الأخطاء (MSE). النتائج تظهر أن الطريقة المقترحة تحقق نسبة ضغط جيدة مع الحفاظ على جودة الصورة وتقليل الأخطاء.
Critical review
دراسة نقدية: يعتبر البحث مساهمة قيمة في مجال ضغط الصور المجسمة، حيث يقدم طريقة مبتكرة تجمع بين عدة خوارزميات لتحقيق ضغط فعال. ومع ذلك، يمكن تحسين البحث من خلال تقديم مقارنة أكثر تفصيلاً مع الطرق الأخرى المستخدمة في ضغط الصور، بالإضافة إلى تقديم تحليل أعمق لأداء الخوارزمية في حالات مختلفة من الصور المجسمة. كما أن استخدام عينات متنوعة من الصور يمكن أن يعزز من موثوقية النتائج. من الجيد أيضاً أن يتم اختبار الطريقة على فيديوهات مجسمة لمعرفة مدى فعاليتها في هذا المجال.
Questions related to the research
-
ما هي الخوارزميات الثلاث المستخدمة في الطريقة المقترحة لضغط الصور المجسمة؟
الخوارزميات الثلاث هي: المقارنة بين الصورتين المكونتين للمنظر المجسم وترميز الفرق بينهما، استخدام التحويل الانحنائي الرقمي لتقليل الفائض بين عناصر الصورة، واستخدام ترميز هوفمان لضغط البيانات بدون فقد.
-
ما هي المعايير المستخدمة لتقييم أداء الخوارزمية المقترحة؟
المعايير المستخدمة هي نسبة ضغط الصورة (Compression Ratio)، جودة الصورة (PSNR)، ومتوسط مربعات الأخطاء (MSE).
-
ما هي الفائدة الرئيسية من استخدام التحويل الانحنائي الرقمي في ضغط الصور المجسمة؟
الفائدة الرئيسية هي قدرته العالية على تمثيل الانحناءات داخل الصورة بأقل عدد من المعاملات، مما يقلل من حجم البيانات المطلوبة لتمثيل الصورة ويحسن من نسبة الضغط.
-
كيف يتم استخدام ترميز هوفمان في الطريقة المقترحة؟
يتم استخدام ترميز هوفمان لترميز خرج التحويل الانحنائي الرقمي ومصفوفة الفرق بين الصورتين، مما يساعد في ضغط البيانات بدون فقدان أي جزء من الصورة أو تشويهها.
References used
Agarwal,A.,Compressing Stereo Images Using a Reference Image and the Exhaustive Block Matching Algorithm to Estimate Disparity between the Two Images. Vol. 32, Canada: International Journal of Advanced Science and Technology (IJAST), 2011
Aziz, T.,& Dolly,D.,Motion Estimation and Motion Compensated Video Compression Using DCT And DWT. Vol. 2,International Journal of Emerging Technology and Advanced Engineering (IJETAE),2012, 667-671
Dalvir, K.,&Kamaljit,K.,Huffman Based LZW Lossless Image Compression Using Retinex Algorithm. Vol. 2, International Journal of Advanced Research in Computer and Communication Engineering (IJARCCE),2013,3145-3151