Do you want to publish a course? Click here

Comparative Study between R and Rapidminer as Data mining Tools

دراسة مقارنة بين R و Rapidminer كأدتين للتنقيب في المعطيات (Data Mining)

3312   5   191   3.0 ( 1 )
 Publication date 2014
and research's language is العربية
 Created by Shamra Editor




Ask ChatGPT about the research

The ability of data mining to provide predictive information derived from huge databases became an effective tool in the hands of companies and individuals، allowing them to focus on areas that are important to them from the massive data generated by the march of their daily lives. Along with the increasing importance of this science there was a rapidly increasing in the tools that produced to implement the theory concepts as fast as possible. So it will be hard to take a decision on which of these tools is the best to perform the desired task. This study provides a comparison between the two most commonly used data mining tools according to opinion polls، namely: Rapidminer and R programming language in order to help researchers and developers to choose the best suited tool for them between the two. Adopted the comparison on seven criteria: platform، algorithms، input/output formats، visualization، user’s evaluation، infrastructure and potential development، and performance by applying a set of classification algorithms on a number of data sets and using two techniques to split data set: cross validation and hold-out to make sure of the results. The Results show that R supports the largest number of algorithms، input/output formats، and visualization. While Rapidminer superiority in terms of ease of use and support for a greater number of platforms. In terms of performance the accuracy of classification models that were built using the R packages were higher. That was not true in some cases imposed by the nature of the data because we did not added any pre-processing stage. Finally the preference option in any tool is depending on the extent of the user experience and purpose that the tool is used for


Artificial intelligence review:
Research summary
تقدم هذه الدراسة مقارنة بين أداتين شائعتين في مجال التنقيب في البيانات، وهما: Rapidminer ولغة البرمجة R. تهدف الدراسة إلى مساعدة الباحثين والمطورين في اختيار الأداة الأنسب لاحتياجاتهم. اعتمدت المقارنة على سبعة معايير: منصة العمل، الخوارزميات المضمنة، صيغ الدخل والخرج، إمكانيات التمثيل الرسومي، تقييم المستخدمين، البنية وإمكانيات التطوير، والأداء. أظهرت النتائج أن R تدعم أكبر عدد من الخوارزميات وصيغ الدخل والخرج والتمثيل الرسومي، بينما تفوقت Rapidminer من حيث سهولة الاستخدام ودعمها لمنصات عمل متعددة. من حيث الأداء، كانت دقة المصنفات التي بنيت باستخدام مكتبات R أعلى، إلا في بعض الحالات التي فرضتها طبيعة المعطيات. في النهاية، يعتمد اختيار الأداة الأنسب على مدى خبرة المستخدم وهدفه من استخدام الأداة.
Critical review
دراسة نقدية: تقدم هذه الدراسة مقارنة شاملة ومفصلة بين أداتين مهمتين في مجال التنقيب في البيانات، وهي توفر معلومات قيمة للباحثين والمطورين. ومع ذلك، يمكن الإشارة إلى بعض النقاط التي قد تحتاج إلى تحسين. أولاً، قد يكون من المفيد تضمين المزيد من الأدوات الأخرى في المقارنة للحصول على رؤية أشمل. ثانياً، يمكن تحسين الدراسة بإضافة تجارب عملية أكثر تنوعاً تشمل مجموعة أوسع من البيانات والخوارزميات. أخيراً، يمكن أن تكون الدراسة أكثر فائدة إذا تضمنت توصيات محددة بناءً على أنواع معينة من التطبيقات أو المستخدمين.
Questions related to the research
  1. ما هي الأداتان اللتان تم مقارنتهما في الدراسة؟

    الأداتان هما Rapidminer ولغة البرمجة R.

  2. ما هي المعايير السبعة التي اعتمدت عليها المقارنة؟

    المعايير السبعة هي: منصة العمل، الخوارزميات المضمنة، صيغ الدخل والخرج، إمكانيات التمثيل الرسومي، تقييم المستخدمين، البنية وإمكانيات التطوير، والأداء.

  3. أي الأداتين تدعم أكبر عدد من الخوارزميات وصيغ الدخل والخرج؟

    لغة البرمجة R تدعم أكبر عدد من الخوارزميات وصيغ الدخل والخرج.

  4. ما هي الأداة التي تفوقت من حيث سهولة الاستخدام ودعم منصات العمل المتعددة؟

    تفوقت أداة Rapidminer من حيث سهولة الاستخدام ودعم منصات العمل المتعددة.


References used
KABACOFF R.2011-R in Action Data Analysis and Graphics with R. Manning Publications، 472 p
HAN J. KAMBER M. and PEI J.2011-Data Mining: Concepts and Techniques. Morgan Kaufmann، Third edition، San Francisco، 744 p
WITTEN I. H. FRANK E. and HALL M. A. 2011-Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann، Third edition، San Francisco، 664p
LIU H. and ZHAO Z. A.2012- Spectral Feature Selection for Data Mining. Chapman & Hall/CRCPress، Virginia Beach، VA، 219p
LIU H. and MODTODA H.2008-Computational Methods of Feature Selection. Chapman & Hall، BocaRaton، FL، 440p
rate research

Read More

في هذا البحث تٌستخدم تقنيات استكشاف الصور كالتجميع و قواعد الاستكشاف لاستكشاف المعرفة من الصورة و أيضاً يستخدم دمج الميزات متعددة الوسائط مثل البصرية و النصية.
Due to the large increase in the use of data communication and information exchange services of different types in different environments, the standard and the programming had to be a language of characterization is ideal for scalability and develo pment that serve the growing needs in the best form and in the shortest possible time and was the most widely used language and the most widely used XML language. he adoption of graphics architecture sometimes created a problem affecting the performance of information transmission networks due to the large volume of data exchanged as well as the need for large storage capacity at both ends of the transmission and reception. Effective ways of reducing the amount of data exchanged through the network had to be found. There have been many scientific researches and practical experiments on finding effective ways to reduce the actual size of the data and by adopting different parameters that affect the process of compressing the files so as to achieve better results by reducing the volumes of files exchanged with attention to times of compression and decompression of files. In this research, we focused on the study and comparison of some compression algorithms for files and their effect on data communication in networks.
This In Vivo study aimed to compare the antibacterial activity of alcoholic extract of propolis and Miswak with sodium hypochlorite and saline. The study was performed on 40 infected single root canals for patients of both sexes, regardless of gender or age.
A study of chemical composition of woman's milk has been made and compared with cow's milk in the province of Homs. The findings of this study show that The total value of the solid material in cow's milk is (12.26 ± 1.2%). It is approximately eq ual to woman 's milk content of the total solid material which is (12.11 ± 0.09%). The woman 's milk content of mineral elements is (02% ± 001%), while the cow's milk content is (0.71 ± 0.14%). For the value of fatty material in the mother's milk, it is (3.5 ± 0.02%) and this is almost equal to cow's milk content of the same material which is (3.4 ± 0.05%). The cow's milk content of protein is equivalent to (2.92 ± 0.019%), whereas cow's milk content is equivalent to ( 1.25 ± 0.009%). The value of calcium in the mother's milk is (32 ± 4.3 mg), and this is significantly lower than the value of the calcium in cow's milk, which is (118 ± 8.2 Mg/ kg).
Through this study we will explain the application of data mining and business intelligence using the data existed in the library of the Arab International University. This data has been linked to the data of the students on the academic system of the university. The study will also answer questions that affect the work of the educational institution in general and the library in particular, propose solutions to improve the work of the library and its services, enhance library working methods, and specify indicators related to the role of information resources in the educational operation.

suggested questions

comments
Fetching comments Fetching comments
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا