ترغب بنشر مسار تعليمي؟ اضغط هنا

تعيين المراكز الابتدائية بشكل مدروس في خوارزمية K-Medoids

Assigned Elementary Centroids Thoughtfully in K-Medoids Algorithm

2382   0   33   0 ( 0 )
 تاريخ النشر 2014
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مع التطور الهائل في جميع المجالات العلمية و الاقتصادية و السياسية و غيرها ظهرت الحاجة لإيجاد طرق غير تقليدية للتعامل من خلالها مع البيانات بجميع أنماطها ( النصية و المرئية و الصوتية و غيرها ) والتي أصبحت ذات حجوم كبيرة جداً في هذه الأيام. فكان لابد من إيجاد طرق جديدة لاستنباط المعرفة و المعلومات المخبأة ضمن هذا الكم الهائل من البيانات كالاستعلام عن الزبائن الذين لديهم عادات شرائية متماثلة أو التوقعات المحتلمة لبيع سمعة معينة في إحدى المناطق الجغرافية و غيرها من الاستعلامات الاستنتاجية و التي تعتمد على تقنية التنقيب في البيانات. و تتم عملية التنقيب بعدة أساليب من أهمها أسلوب العنقدة (التجميع) Clustering و الذي يتم بعدة خوارزميات. سوف نرّكز في بحثنا هذا على استخدام طريقة مدروسة لإيجاد المراكز الابتدائية لخوارزمية K-Medoids التي تقوم على مبدأ تقسيم البيانات إلى عناقيد كل عنقود يحوي بيانات متماثمة يَسهل التعامل معها بدلاً من اختيارها بالشكل العشوائي الذي يؤدي بدوره لظهور نتائج مختلفة وبطئ في تنفيذ الخوارزمية .


ملخص البحث
يتناول البحث الذي قدمه طه مختار البابا تحسين خوارزمية K-Medoids المستخدمة في عملية العنقدة أو التجميع في التنقيب عن البيانات. يوضح البحث أهمية التنقيب في البيانات في العصر الحالي الذي يتميز بالانفجار المعلوماتي، ويستعرض كيفية تحسين أداء خوارزمية K-Medoids من خلال تعيين المراكز الابتدائية بشكل مدروس بدلاً من اختيارها عشوائياً. يهدف هذا التحسين إلى تقليل عدد التكرارات اللازمة لتنفيذ الخوارزمية وتقليل الزمن المستغرق في التنفيذ، مما يجعلها أكثر كفاءة في التعامل مع البيانات الكبيرة. تم اختبار الخوارزمية المعدلة باستخدام تطبيق برمجي بلغة #C، وأظهرت النتائج تحسناً ملحوظاً في الأداء مقارنة بالخوارزمية العادية. يوصي البحث باستخدام الخوارزمية المعدلة في مجالات تتطلب التعامل مع كميات كبيرة من البيانات مثل بيانات الطلبة في وزارتي التربية والتعليم العالي.
قراءة نقدية
دراسة نقدية: يعتبر البحث خطوة مهمة نحو تحسين خوارزمية K-Medoids، إلا أنه يواجه بعض التحديات. من أبرز هذه التحديات هو أن الخوارزمية المعدلة قد لا تكون فعالة بنفس القدر مع جميع أنواع البيانات، حيث أن تحسين الأداء يعتمد بشكل كبير على طبيعة البيانات المستخدمة. كما أن البحث لم يتناول بشكل كافٍ كيفية التعامل مع البيانات الشاذة التي قد تؤثر على دقة النتائج. بالإضافة إلى ذلك، قد يكون من المفيد توسيع نطاق الاختبارات لتشمل أنواعاً مختلفة من البيانات واستخدام تقنيات أخرى للمقارنة. على الرغم من هذه النقاط، فإن البحث يقدم إسهاماً قيماً في مجال التنقيب عن البيانات ويضع أساساً لتحسينات مستقبلية.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من البحث؟

    الهدف الرئيسي من البحث هو تحسين أداء خوارزمية K-Medoids من خلال تعيين المراكز الابتدائية بشكل مدروس بدلاً من اختيارها عشوائياً، مما يقلل من عدد التكرارات والزمن المستغرق في التنفيذ.

  2. ما هي الفوائد المتوقعة من استخدام الخوارزمية المعدلة؟

    الفوائد المتوقعة تشمل تحسين كفاءة الخوارزمية في التعامل مع البيانات الكبيرة، تقليل عدد التكرارات اللازمة، وتقليل الزمن المستغرق في التنفيذ، مما يجعلها أكثر فعالية في مجالات تتطلب تحليل كميات كبيرة من البيانات.

  3. ما هي التحديات التي يواجهها البحث؟

    التحديات تشمل فعالية الخوارزمية المعدلة مع أنواع مختلفة من البيانات، التعامل مع البيانات الشاذة، وتوسيع نطاق الاختبارات لتشمل تقنيات أخرى للمقارنة.

  4. ما هي التوصيات المستقبلية التي يقدمها البحث؟

    يوصي البحث بزيادة فعالية الخوارزمية وزيادة كفاءتها لتصبح ذات فائدة أكبر في التعامل مع البيانات الكبيرة جداً مثل مواقع الانترنت بجميع مجالاتها واختصاصاتها.


المراجع المستخدمة
Dunham, M. H. 2003-Data Mining: Introductory and Advanced Topics. Prentice Hal Bazsalica, 328p
Kaufman,L. Rousseeuw,P2010-Finding Groups in Data: an .Introduction to Cluster Analysis. John,170p
Berry,J. Linoff.G2004-Data Mining Techniques For Marketing, Sales, and Customer Relationship Management, Indianapolis,150p
Ng,R, Han.J-2008-Efficient and Effective Clustering Methods for Spatial Data Mining, Conf, 144p
Xu Yifeng Chen Chunming. 2009 ONTOLOGY-BASED WEB MINING Computer Applications and software, 180p
قيم البحث

اقرأ أيضاً

تصنف خوارزمية K-Means الكائنات إلى عدد محدد مسبقا من العناقيد و هو K عنقود. و تتم عملية اختيار المراكز العنقودية في هذه الخوارزمية بشكل العشوائية، و يفضل أن تكون هذه المراكز بعيدة عن بعضها البعض قدر الإمكان. تؤثر نقطة البدء العشوائية على فعالية عملي ة التجميع و النتائج. و تعتمد عملية المقاربة المعنقدة على قيم المراكز الأولية بشكل رئيسي. نركّز في هذا البحث على طريقة اختيار مركز العنقود لتحسين أداء العنقدة في الخوارزمية K-Means كما نستخدم مراكز العناقيد الأولية و التي حصلنا عليها من البيانات المقسّمة على طول محور البيانات وفقا لأعلى فرق لتعيين مركز العنقود الأفضل.
نقدم في هذا البحث خوارزمية جديدة لحل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات كالK-Means. هذه الخوارزمية الجديدة قادرة على عنقدة مجموعة من البيانات بشكل منفرد دون الحاجة لخوارزميات عنقدة أخرى.
بعد نجاح اهتمام DOT-Product في المحولات، تم اقتراح تقريب عديدة مؤخرا لمعالجة تعقيدها التربيعي فيما يتعلق بطول الإدخال. في حين أن هذه المتغيرات هي الذاكرة وتحسب كفاءة، فمن غير الممكن استخدامها مباشرة مع نماذج اللغة المدربة مسبقا مسبقا تدربت باستخدام ا هتمام الفانيليا، دون مرحلة ما قبل التدريب التصحيحية باهظة الثمن. في هذا العمل، نقترح تقريب بسيط ولكن دقيق للغاية لاهتمام الفانيليا. نقوم بمعالجة الاستعلامات في قطع، ولكل عملية استعلام، حساب أعلى الدرجات * K * فيما يتعلق بالمفاتيح. يوفر نهجنا عدة مزايا: (أ) استخدام ذاكرةه خطي في حجم الإدخال، على غرار متغيرات الانتباه الخطي، مثل أداء و RFA (B) هو استبدال انخفاض في انتباه الفانيليا الذي لا يتطلب أي تصحيحية -إجراء (ج) يمكن أن يؤدي أيضا إلى وفورات كبيرة في الذاكرة في طبقات الأعلاف إلى الأمام بعد إلقاءها في إطار القيمة المألوفة ذات القيمة الرئيسية. نحن نقيم جودة أعلى - * K * تقريب طبقات الاهتمام متعدد الأطراف على أساس الساحة الطويلة المدى، وللطبقات التغذية من T5 و unifectqa على مجموعات بيانات QA متعددة. نظرا لأن نهجنا يؤدي إلى الدقة التي تظل مما يقرب من انتباه الفانيليا في إكمال متعددة بما في ذلك التدريب من الصفر والضبط الناعم والاستدلال بالرصاص الصفر.
Jujeop هو نوع من التورية وسيلة فريدة من نوعها للمشجعين للتعبير عن حبهم لنجوم K-Pop، يتبعون باستخدام الكورية.واحدة من الخصائص الفريدة ل Jujeop هي استخدامها للتعبيرات المبالغ فيها لمصدر نجوم K-Pop، والتي تحتوي على الفكاهة أو تؤدي إلى الفكاهة.بناء على ه ذه الخصائص، يمكن فصل Jujeop إلى أربعة أنواع مميزة، مع تجاهلاتها المعجمية الخاصة بها: (1) كلمات تجزئة لإنشاء تطور، (2) هوليديون ومناسبي، (3) التكرار، و (4) هراء.وبالتالي، تحدد الدراسة الحالية أولا مفهوم Jujeop في الكورية، علامات 8.6k يدويا وتعليق التعليقات على واحد من أنواع عصير الأربعة.مع Corpus المعطاة المشروح، تقدم هذه الدراسة خصائص مميزة لتعليقات Jujeop مقارنة بالتعليقات الأخرى بمهمة التصنيف.علاوة على ذلك، مع نهج التجميع، اقترحنا التبعية الهيكلية داخل كل نوع خجويل.لقد صنعنا DataSet الخاص بنا للجمهور للبحث في المستقبل على تعبيرات Jujeop.
درسنا في هذا البحث بعض خواص أسرة واسعة من المنحنيات و التي تسمى k- منحنيات، و التي تعرف من خلال : وجود علاقة بين أطوال الأقواس و الأوتار التي تصل بين أية نقطتين منها بشكل خاص درسنا تأثير بعض التحويلات في منحنيات هذه الأسرة و من ثم درسنا تقريب صف دوال هولدر الموزن المعرفة على أسرة المنحنيات – k.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا