ترغب بنشر مسار تعليمي؟ اضغط هنا

خوارزمية جديدة لعنقدة البيانات و تحسين خوارزمية الK-Means

A New Algorithm for Data Clustering and Enhancing K-Means Algorithm

3197   6   69   0 ( 0 )
 تاريخ النشر 2016
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم في هذا البحث خوارزمية جديدة لحل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات كالK-Means. هذه الخوارزمية الجديدة قادرة على عنقدة مجموعة من البيانات بشكل منفرد دون الحاجة لخوارزميات عنقدة أخرى.


ملخص البحث
تقدم هذه الورقة البحثية خوارزمية جديدة تهدف إلى حل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات مثل خوارزمية الـK-Means. تعتمد الخوارزمية الجديدة على حساب قيمة مناسبة للثابت α، الذي يمثل نصف قطر الجوار حيث يجب أن تتواجد الكائنات (النقاط) التي تنتمي للعنقود. يمكن استخدام الخوارزمية الجديدة لتحديد العدد المناسب من العناقيد وتحديد المراكز الابتدائية بشكل آلي، مما يقلل من الخطأ وعدد التكرارات في خوارزمية الـK-Means. تم تقديم مقارنة بين أداء خوارزمية الـK-Means الأصلية وخوارزمية الـK-Means بعد إدخال خرج الخوارزمية الجديدة، حيث أظهرت النتائج تقليل الخطأ وعدد التكرارات.
قراءة نقدية
دراسة نقدية: تعتبر هذه الورقة البحثية مساهمة قيمة في مجال عنقدة البيانات، حيث تقدم خوارزمية جديدة تحل بعض المشاكل الشائعة في خوارزمية الـK-Means. ومع ذلك، يمكن تحسين الورقة من خلال تقديم تحليل أعمق للأداء الزمني للخوارزمية الجديدة مقارنة بالخوارزميات الأخرى. كما يمكن تضمين تجارب إضافية على مجموعات بيانات متنوعة للتحقق من فعالية الخوارزمية في سياقات مختلفة. بالإضافة إلى ذلك، يمكن توضيح كيفية تحديد الثابت α بشكل أكثر تفصيلاً لتسهيل تطبيق الخوارزمية من قبل الباحثين الآخرين.
أسئلة حول البحث
  1. ما هي المشكلة الرئيسية التي تحاول الخوارزمية الجديدة حلها في خوارزمية الـK-Means؟

    تحاول الخوارزمية الجديدة حل مشاكل التحديد المسبق لعدد العناقيد والتحديد العشوائي للمراكز الابتدائية في خوارزمية الـK-Means.

  2. كيف يتم تحديد نصف قطر الجوار α في الخوارزمية الجديدة؟

    يتم تحديد نصف قطر الجوار α من خلال حساب مصفوفة الأبعاد D بين كل نقطتين مختلفتين واستخدام العلاقة الرياضية المناسبة لحساب α.

  3. ما هي الفائدة الرئيسية من استخدام الخوارزمية الجديدة مع خوارزمية الـK-Means؟

    الفائدة الرئيسية هي تقليل الخطأ وعدد التكرارات في خوارزمية الـK-Means من خلال تحديد العدد المناسب من العناقيد والمراكز الابتدائية بشكل آلي.

  4. هل تم اختبار الخوارزمية الجديدة على مجموعات بيانات متنوعة؟

    نعم، تم اختبار الخوارزمية الجديدة على مجموعات بيانات مختلفة وأظهرت النتائج فعالية الخوارزمية في تقليل الخطأ وعدد التكرارات.


المراجع المستخدمة
HAN, J, AND KAMBER, M. 2006- Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, New Delhi, (2nd ed), 772p
RAUF, A, SHEEBA, S, KHUSOR, S, AND JAVED, H.2012- Enhanced K-Mean Clustering Algorithm to Reduce Number of Iterations and Time Complexity, Middle-East Journal of Scientific Research, Pakistan
ALARBEA, A, SENTHEKUMAR, H, AND BADER, A. 2013- Enhancing K-Means Algorithm with Initial Cluster Centers Derived from Data Partitioning along the Data Axis with PCA, Journal of Advances in Computer Networks, Vol. 1, No. 2, June 2013
قيم البحث

اقرأ أيضاً

تصنف خوارزمية K-Means الكائنات إلى عدد محدد مسبقا من العناقيد و هو K عنقود. و تتم عملية اختيار المراكز العنقودية في هذه الخوارزمية بشكل العشوائية، و يفضل أن تكون هذه المراكز بعيدة عن بعضها البعض قدر الإمكان. تؤثر نقطة البدء العشوائية على فعالية عملي ة التجميع و النتائج. و تعتمد عملية المقاربة المعنقدة على قيم المراكز الأولية بشكل رئيسي. نركّز في هذا البحث على طريقة اختيار مركز العنقود لتحسين أداء العنقدة في الخوارزمية K-Means كما نستخدم مراكز العناقيد الأولية و التي حصلنا عليها من البيانات المقسّمة على طول محور البيانات وفقا لأعلى فرق لتعيين مركز العنقود الأفضل.
نقدم في هذا البحث تعديل لخوارزمية عنقدة البيانات الMountain الضبابية, تمكنا من جعل هذه الخوارزمية تعمل بشكل آلي, و ذلك من خلال إيجاد طريقة لتقسيم الفضاء و تحديد قيم وسطاء الدخل و شرط التوقف آلياً بدلاً من إدخالها من قبل المستخدم.
قدم في هذا البحث تعديل لخوارزمية عنقدة البيانات الMountain الضبابية, حيث تمكنا من جعل هذه الخوارزمية تعمل بشكل آلي, و ذلك من خلال إيجاد طريقة لتقسيم الفضاء و تحديد قيم وسطاء الدخل و شرط التوقف آلياً بدلاً من إدخالها من قبل المستخدم.
تعتمد معظم خوارزميات التوقيع الرقمي الحالية في بنيتها على مفاهيم رياضية معقدة يتطلب تنفيذها وقتاً طويلاً و جيداً حسابياً كبيرا. و كمحاولة للتخفيف من هذه المشاكل اقترح بعض الباحثون خوارزميات توقيع رقمي تعتمد على توابع و عمليات حسابية بسيطة سريعة التنفيذ، إلا أن ذلك كان على حساب الأمان.
كما هو معروف فإن مسألة تلوين بيان باستخدام أقل عدد من الألوان هي مسألة معقدة (NP-Hard) المشكلة تتلخص في كيفية تلوين عقد بيان بأقل عدد ممكن من الألوان . و بحيث لا يكون لأي عقدتين متجاورتين اللون نفسه، أو كيف يمكن تلوين أضلاع هذا البيان بأقل عدد ممك ن من الألون بحيث لا يكون لضلعين يشتركان بعقدة اللون نفسه. نقدم في هذه الورقة البحثية خوارزمية تلوين جديدة لأضلاع بيان. هذه الخوارزمية تُمكننا من الحصول على تلوين ضلعي مستمر لصف من البيانات الشهيرة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا