ترغب بنشر مسار تعليمي؟ اضغط هنا

دراسة مقارنة بين R و Rapidminer كأدتين للتنقيب في المعطيات (Data Mining)

Comparative Study between R and Rapidminer as Data mining Tools

3302   5   191   3.0 ( 1 )
 تاريخ النشر 2014
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تمثل قدرة التنقيب في المعطيات ( Data Mining ) على استخلاص معلومات تنبوئية من قواعد معطيات ضخمة أداة فعالة في يد الشركات و الأفراد تتيح لهم التركيز على النواحي التي تهمهم من المعطيات الضخمة التي تولدها مسيرة عملهم اليومية. و مع تزايد أهمية هذا العلم تزايدت بشكل متسارع الأدوات التي بنيت لتطبيق مفاهيمه النظرية بأسرع ما يمكن , حتى غدا من الصعب اتخاذ القرار حول أي من هذه الأدوات هو الأمثل لأداء مهمتك المرجوة. تقدم الدراسة مقارنة بين أداتي التنقيب في المعطيات الأكثر استخداما وفقا لاستطلاعات الرأي و هما Rapidminer و لغة البرمجة R بهدف مساعدة الباحث أو المطور على اختيار الأنسب بينهما. اعتمدت المقارنة على سبعة معايير : منصة العمل , الخوارزميات المضمنة, الصيغ المتاحة للدخل و الخرج , إمكانية التمثيل الرسومي , تقييم المستخدمين , البنية و امكانيات التطوير , الأداء بتطبيق مجموعة من خوارزميات التصنيف على عدد من مجموعات البيانات ( data set ) و باستخدام تقنيتي تقسيم cross validation و hold-out للتأكد من النتائج . من خلال الدراسة تبين أن R هي الأداة التي تدعم أكبر عدد من الخوارزميات و صيغ الدخل و الخرج و التمثيل الرسومي بينما تفوق Rapidminer من حيث سهولة الاستخدام و دعمه لعدد أكبر من منصات العمل. أما من حيث الأداء فدقة المصنفات التي بنيت باستخدام مكتبات كانت أعلى إلا في بعض الحالات التي فرضتها طبيعة المعطيات حيث لم يضف أي مرحلة معالجة مسبقة. و أخيرا يغدو الخيار في تفضيل أي الأداتين معتمدا على مدى خبرة المستخدم و هدفه من استخدام الأداة.


ملخص البحث
تقدم هذه الدراسة مقارنة بين أداتين شائعتين في مجال التنقيب في البيانات، وهما: Rapidminer ولغة البرمجة R. تهدف الدراسة إلى مساعدة الباحثين والمطورين في اختيار الأداة الأنسب لاحتياجاتهم. اعتمدت المقارنة على سبعة معايير: منصة العمل، الخوارزميات المضمنة، صيغ الدخل والخرج، إمكانيات التمثيل الرسومي، تقييم المستخدمين، البنية وإمكانيات التطوير، والأداء. أظهرت النتائج أن R تدعم أكبر عدد من الخوارزميات وصيغ الدخل والخرج والتمثيل الرسومي، بينما تفوقت Rapidminer من حيث سهولة الاستخدام ودعمها لمنصات عمل متعددة. من حيث الأداء، كانت دقة المصنفات التي بنيت باستخدام مكتبات R أعلى، إلا في بعض الحالات التي فرضتها طبيعة المعطيات. في النهاية، يعتمد اختيار الأداة الأنسب على مدى خبرة المستخدم وهدفه من استخدام الأداة.
قراءة نقدية
دراسة نقدية: تقدم هذه الدراسة مقارنة شاملة ومفصلة بين أداتين مهمتين في مجال التنقيب في البيانات، وهي توفر معلومات قيمة للباحثين والمطورين. ومع ذلك، يمكن الإشارة إلى بعض النقاط التي قد تحتاج إلى تحسين. أولاً، قد يكون من المفيد تضمين المزيد من الأدوات الأخرى في المقارنة للحصول على رؤية أشمل. ثانياً، يمكن تحسين الدراسة بإضافة تجارب عملية أكثر تنوعاً تشمل مجموعة أوسع من البيانات والخوارزميات. أخيراً، يمكن أن تكون الدراسة أكثر فائدة إذا تضمنت توصيات محددة بناءً على أنواع معينة من التطبيقات أو المستخدمين.
أسئلة حول البحث
  1. ما هي الأداتان اللتان تم مقارنتهما في الدراسة؟

    الأداتان هما Rapidminer ولغة البرمجة R.

  2. ما هي المعايير السبعة التي اعتمدت عليها المقارنة؟

    المعايير السبعة هي: منصة العمل، الخوارزميات المضمنة، صيغ الدخل والخرج، إمكانيات التمثيل الرسومي، تقييم المستخدمين، البنية وإمكانيات التطوير، والأداء.

  3. أي الأداتين تدعم أكبر عدد من الخوارزميات وصيغ الدخل والخرج؟

    لغة البرمجة R تدعم أكبر عدد من الخوارزميات وصيغ الدخل والخرج.

  4. ما هي الأداة التي تفوقت من حيث سهولة الاستخدام ودعم منصات العمل المتعددة؟

    تفوقت أداة Rapidminer من حيث سهولة الاستخدام ودعم منصات العمل المتعددة.


المراجع المستخدمة
KABACOFF R.2011-R in Action Data Analysis and Graphics with R. Manning Publications، 472 p
HAN J. KAMBER M. and PEI J.2011-Data Mining: Concepts and Techniques. Morgan Kaufmann، Third edition، San Francisco، 744 p
WITTEN I. H. FRANK E. and HALL M. A. 2011-Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann، Third edition، San Francisco، 664p
LIU H. and ZHAO Z. A.2012- Spectral Feature Selection for Data Mining. Chapman & Hall/CRCPress، Virginia Beach، VA، 219p
LIU H. and MODTODA H.2008-Computational Methods of Feature Selection. Chapman & Hall، BocaRaton، FL، 440p
قيم البحث

اقرأ أيضاً

في هذا البحث تٌستخدم تقنيات استكشاف الصور كالتجميع و قواعد الاستكشاف لاستكشاف المعرفة من الصورة و أيضاً يستخدم دمج الميزات متعددة الوسائط مثل البصرية و النصية.
نظرا للتزايد الكبير لاستخدام تراسل البيانات و خدمات تبادل المعلومات بأنواع مختلفة ضمن بيئات متباينة عتادياً و برمجياً كان لابد من وجود لغة توصيف مثالية قابلة للتوسع و التطوير تخدم هذه الاحتياجات المتزايدة بأفضل شكل و بأقصر وقت ممكن و كانت اللغة الاكث ر انتشاراً و الأكثر استخداماً لغة XML. كما أن اعتماد بنية الرسوميات احياناً خلق مشكلة أثرت على أداء شبكات نقل المعلومات نظرا للحجم الكبير للبيانات المتبادلة و كذلك الحاجة لسعة تخزينية كبيرة في طرفي الارسال و الاستقبال لذا كان لابد من إيجاد طرق فعالة لإنقاص حجم تلك البيانات التي يتم تبادلها من خلال الشبكة. تم إجراء العديد من الأبحاث العلمية و التجارب العملية حول إيجاد طرق فعالة لإنقاص الحجم الفعلي للبيانات و باعتماد بارامترات مختلفة تؤثر على عملية ضغط الملفات بحيث تحقق نتائج أفضل بالتقليل من حجوم الملفات المتبادلة مع الانتباه الى أزمنة ضغط و فك الضغط للملفات. لذا تم التركيز في هذا البحث على دراسة و مقارنة لبعض خوارزميات الضغط للملفات و بيان أثرها على تراسل البيانات في الشبكات.
هدفت هذه الدراسة إلى مقارنة الفعالية المضادة للبكتيريا للمستخلص الكحولي لعكبر النحل و المسواك مع هيبوكلوريت الصوديوم و السالين في إرواء الأقنية الجذرية العفنة. أجريت الدراسة سريرياً على 40 سن عفنة وحيدة الجذر لمرضى من كلا الجنسين، دون اعتبار للجنس أو العمر.
تم دراسة التركيب الكيميائي لحليب الأم و مقارنته مع حليب الأبقار في محافظة حمص - إن قيمة المادة الصلبة الكلية في حليب الأبقار (12.26 ± 1.2%) مساوية تقريبا لمحتوى حليب الأم من المادة الصلبة الكلية (12.11 ± 0.09%). - بلغ محتوى حليب الام من العناصر ال معدنية (02% ±001%)في حين أن محتوى الأبقار(0.71 ± 0.14%) - بالنسبة لقيمة المادة الدسمة في حليب الأم (3.5 ± 0.02%)تتساوى تقريبا مع محتوى حليب الأبقار من المادة الدسمة(3.4 ± 0.05%). - محتوى حليب الأبقار من المادة البروتينية يعادل(2.92 ± 0.019%) في حين محتوى حليب الأم يعادل( 1.25 ± 0.009%) إن قيمة الكالسيوم في حليب الأم (32 ± 4.3 mg)أقل بكثير من قيمة الكالسيوم في حليب الأبقار(118 ± 8.2 Mg/ kg).
يعرض هذا البحث آليات تطبيق تقنيات التنقيب في المعطيات و حلول ذكاء الأعمال على المعطيات الموجودة ضمن مكتبة الجامعة العربية الدولية بعد ربطها بمعطيات الطلاب الموجودة ضمن النظام الأكاديمي الخاص بالجامعة، و الإجابة عن مجموعة من الأسئلة و الاستفسارات ا لتي من الممكن أن تؤثر في سير العمل ضمن المؤسسة التعليمية بوجه عام و ضمن مكتبة الجامعة بوجه خاص، و تقديم بعض الحلول لمساعدة المكتبة في تطوير خدماتها، و تطوير آليات العمل ضمنها، إضافة إلى تحديد بعض المؤشرات المتعلقة بدور موارد المعلومات في تطوير العملية التعليمية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا