لتوصيل المعلومات بوضوح وكفاءة ، يستخدم تمثيل البيانات رسومات إحصائية ومعلومات وأدوات أخرى. قد يتم تشفير البيانات الرقمية باستخدام نقاط أو خطوط أو أشرطة لتوصيل المعلومات بصريًا. التمثيل الفعال يساعد المستخدمين على تحليل البيانات وتفسيرها، فهو يجعل الب
يانات المعقدة سهلة الوصول ومفهومة وقابلة للاستخدام. تُستخدم الجداول عمومًا حيث يبحث المستخدمون عن قياس محدد ، بينما تُستخدم المخططات ذات الأنواع المختلفة لإظهار أنماط أو علاقات في البيانات لمتغير واحد أو أكثر.
حظي مؤخرا اختصاص البيانات الضخمة باهتمام كبير في مجالات متنوعة منها (الطب , العلوم , الادارة, السياسة , ......)
و يهتم هذا الاختصاص بدراسة مجموعة البيانات الضخمة والتي تعجز الادوات والطرق الشائعة على معالجتها و ادارتها و تنظيمها خلال فترة زمنية مقبو
لة و بناء نموذج للتعامل مع هذه المعطيات والتنبؤ باغراض مطلوبة منها.
ولاجراء هذه الدراسات ظهرت طرق عدة منها النماذج التي تعتمد على مجموعة من البيانات و نماذج تعتمد على المحاكاة و في هذه المقالة تم توضيح الفرق بين النموذجين و تطبيق نهج جديد يعتمد على التكامل بين النموذجين لاعطاء نموذح افضل لمعالجة مسالة البيوت البلاستيكة
تحظى الأبحاث حول البيانات الضخمة باهتمام العديد من العلماء.حيث أن هناك العديد من الحلول لمشاكل التكتل الشائعة ، ولكن تكتل البيانات الكبيرة بدأ الاهتمام به حديثاً. في هذه الورقة البحثية، تم أقتراح حلاً لتكتل البيانات الكبيرة عن طريق تقليل الميزات من خ
لال طريقة جديدة في تقليل الأبعاد استناداً إلى Johnson Lindenstraus lemma ثم تقسيم البيانات إلى مجموعات صغيرة ثم تجميعها محلياً وأخيراً تكتيل المجموعات .(BDC-RPFR & CFCM) تظهر الاختبارات أن استخدام هذه الطريقة يعطي نتائج وأداء أفضل.
من خلال دراستنا تم تطوير مكتبة برمجية HadoopOperationTesting تقدم لمختبري تطبيقات البيانات الضخمة آلية لاختبار تطبيقاتهم ضمن بيئة محاكية لبيئة Hadoop بآلية مشابهة لاختبار التطبيقات التقليدية باستخدام المكتبة JUnit.