Intelligent System to Reduce Size and Time of Video Display

نظام ذكي لتقليص حجم و زمن عرض الفيديو

 Publication date 2018
and research's language is العربية
 Created by Shamra Editor

Smart shorthand, to display video content, is one of the main problems in computer vision literature, because it is important to reduce the size of video storage in various media, especially in mobile phones and monitoring cameras, and reduce the time needed to watch video. The smart shorthand process is to build software capable of displaying and save important content from the viewer, which contains new details, either in terms of the image or in the accompanying voice and deleting scenes with repeated content. In this research, a new methodology was introduced to extract new scenes in the image and sound, without affecting the continuity of motion within the video, and in a manner that ensures continuous viewing. The methodology relied on two basic algorithms: the first algorithm works to extract scenes with variable details in the image, based on the eigenvalues of the scenes, which show a significant change in the details of the scene, while the second algorithm is based on the extraction of sound with variable details, based on the algorithm introduced in 1985 from [1], which can encode the sound signal with a double-value frame 1 or 0, in the signal area containing details that takes value 1, while in the non- Details takes value 0, the two algorithms are executed synchronously, and thus the variable scenes and the adjacent acoustic signal are drawn. The methodology used to work on large video clips in terms of movement of objects within them has achieved very good effectiveness, great accuracy in synchronization between the scenes and sound adjacent to them.

تتناول هذه الورقة البحثية موضوع نظام ذكي لتقليص حجم وزمن عرض الفيديو، وهو موضوع مهم في مجال الرؤية الحاسوبية. يهدف البحث إلى تطوير برمجية قادرة على عرض وتخزين المحتوى الهام من الفيديو، مع حذف المشاهد المتكررة. تعتمد المنهجية المقترحة على خوارزميتين رئيسيتين: الأولى لاستخلاص المشاهد ذات التفاصيل المتغيرة في الصورة باستخدام القيم الذاتية، والثانية لاستخلاص الصوت المتغير باستخدام خوارزمية تعتمد على نظرية نايكويست-شانون. تم تطبيق المنهجية على مقاطع فيديو متنوعة وحققت نتائج فعالة في تقليص حجم الفيديو مع الحفاظ على دقة التزامن بين المشاهد والصوت. كما تم استخدام الهرم الغاوسي لتقليل حجم الإطارات ومعالجة الصوت باستخدام عدة خطوات تشمل التنعيم، الاشتقاق، التربيع، التكامل، وكشف القمة. النتائج أظهرت أن المنهجية المقترحة فعالة في تقليص حجم الفيديو وزمن عرضه مع الحفاظ على جودة المحتوى وتزامن الصوت مع الصورة. تم تنفيذ الخوارزمية باستخدام لغة البرمجة جافا ومكتبات متعددة لمعالجة الفيديو والصوت. الخوارزمية المقترحة تعتبر ذات أهمية اقتصادية كبيرة خاصة في أنظمة الهواتف النقالة وكاميرات المراقبة.
تعتبر هذه الورقة البحثية خطوة مهمة نحو تحسين تقنيات تقليص حجم وزمن عرض الفيديو، ولكن هناك بعض النقاط التي يمكن تحسينها. أولاً، تعتمد المنهجية بشكل كبير على القيم الذاتية والهرم الغاوسي، مما قد يتطلب موارد حسابية كبيرة ويزيد من تعقيد النظام. ثانياً، لم يتم التطرق بشكل كافٍ إلى كيفية التعامل مع الفيديوهات ذات الجودة العالية أو الفيديوهات التي تحتوي على مشاهد سريعة الحركة. ثالثاً، يمكن تحسين الخوارزمية من خلال دمج تقنيات التعلم الآلي لتوقع القيم الذاتية ومستوى الهرم المناسب لكل فيديو بشكل ديناميكي. أخيراً، يمكن أن تكون النتائج أكثر شمولية إذا تم اختبار الخوارزمية على مجموعة أكبر من الفيديوهات المتنوعة من حيث المحتوى والجودة.
  1. ما هي الأهداف الرئيسية لهذا البحث؟

    يهدف البحث إلى تطوير برمجية قادرة على تقليص حجم وزمن عرض الفيديو من خلال استخلاص المشاهد الهامة وحذف المشاهد المتكررة، مع الحفاظ على تزامن الصوت والصورة.

  2. ما هي الخوارزميات المستخدمة في المنهجية المقترحة؟

    تعتمد المنهجية على خوارزميتين رئيسيتين: الأولى لاستخلاص المشاهد ذات التفاصيل المتغيرة في الصورة باستخدام القيم الذاتية، والثانية لاستخلاص الصوت المتغير باستخدام خوارزمية تعتمد على نظرية نايكويست-شانون.

  3. ما هي التحديات التي واجهتها المنهجية المقترحة؟

    من التحديات الرئيسية التي واجهتها المنهجية هي الحاجة إلى موارد حسابية كبيرة لحساب القيم الذاتية، وصعوبة التعامل مع الفيديوهات ذات الأبعاد المستطيلة، بالإضافة إلى الحاجة إلى تحسين تزامن الصوت مع الصورة.

  4. كيف تم تقييم فعالية الخوارزمية المقترحة؟

    تم تقييم فعالية الخوارزمية من خلال تطبيقها على 100 فيديو متنوع، حيث أظهرت النتائج أن الخوارزمية حققت درجة فهم تصل إلى 86.65% ودرجة تزامن تصل إلى 99% بين الصوت والصورة.

PAN, J., TOMPKINS, W. J. A real-time QRS detection algorithm. IEEE Trans. Biomed. Eng., BME-32(3), 1985 pp 230-236
VIJEETKUMAR, B., DINESH, R., PUNITHA, .P, RAO, V. Key frame extraction and shot boundary detection using Eigenvalues. International Journal of Information and Electronics Engineering vol. 5, no. 1, India, 2015 pp 40-45
ESAKKIRAJAN, S., JAYARAMAN, S., VEERAKUMAR, T. Digital Image processing. Tata McGraw Hill, New Delhi, 2015 pp 719
