ترغب بنشر مسار تعليمي؟ اضغط هنا

تمثل قدرة التنقيب في المعطيات ( Data Mining ) على استخلاص معلومات تنبوئية من قواعد معطيات ضخمة أداة فعالة في يد الشركات و الأفراد تتيح لهم التركيز على النواحي التي تهمهم من المعطيات الضخمة التي تولدها مسيرة عملهم اليومية. و مع تزايد أهمية هذا العلم ت زايدت بشكل متسارع الأدوات التي بنيت لتطبيق مفاهيمه النظرية بأسرع ما يمكن , حتى غدا من الصعب اتخاذ القرار حول أي من هذه الأدوات هو الأمثل لأداء مهمتك المرجوة. تقدم الدراسة مقارنة بين أداتي التنقيب في المعطيات الأكثر استخداما وفقا لاستطلاعات الرأي و هما Rapidminer و لغة البرمجة R بهدف مساعدة الباحث أو المطور على اختيار الأنسب بينهما. اعتمدت المقارنة على سبعة معايير : منصة العمل , الخوارزميات المضمنة, الصيغ المتاحة للدخل و الخرج , إمكانية التمثيل الرسومي , تقييم المستخدمين , البنية و امكانيات التطوير , الأداء بتطبيق مجموعة من خوارزميات التصنيف على عدد من مجموعات البيانات ( data set ) و باستخدام تقنيتي تقسيم cross validation و hold-out للتأكد من النتائج . من خلال الدراسة تبين أن R هي الأداة التي تدعم أكبر عدد من الخوارزميات و صيغ الدخل و الخرج و التمثيل الرسومي بينما تفوق Rapidminer من حيث سهولة الاستخدام و دعمه لعدد أكبر من منصات العمل. أما من حيث الأداء فدقة المصنفات التي بنيت باستخدام مكتبات كانت أعلى إلا في بعض الحالات التي فرضتها طبيعة المعطيات حيث لم يضف أي مرحلة معالجة مسبقة. و أخيرا يغدو الخيار في تفضيل أي الأداتين معتمدا على مدى خبرة المستخدم و هدفه من استخدام الأداة.
هدفت هذه الدراسة إلى بيان مستوى الاهتمام بالتطبيق و بالمجالات المكونة لبيئة مفاهيم تطبق التنقيب و أدواته عن البيانات لإدارة العمليات المصرفية في البنوك التجارية الأردنية. و لتحقيق تلك الأهداف استخدم الباحث المنهج الوصفي التحليلي القائم على الاستبيان الموزع على افراد مجتمع الدراسة. و قد توصل الباحث إلى أن نسبة الاهتمام لدى أفراد مجتمع الدراسة بتطبيق مفاهيم التنقيب عن البيانات لإدارة العمليات المصرفية، كانت مرتفعة بشكل عام إذ بلغ المتوسط الحسابي لهذا المتغير ( 4.005 ). و أن ترتيب المجالات التي قد ينظر إليها عند البحث في تطبيق مفاهيم التنقيب عن البيانات التي تناولتها هذه الدراسة كانت بحسب أهميتها و مستوى الاهتمام بها لدى أفراد مجتمع الدراسة، كالآتي: بيئة العمل المعرفي مع تكنولوجيا المعلومات " قد حصل هذا المتغير على أعلى متوسط، و بلغ متوسطه الحسابي ( 4.02 )، يليه محور " فرص تعزيز نظم المعرفة مع تطوير بيئة نظم البحث و الاسترجاع للبيانات.
تقدم هذه الورقة البحثية مقارنة لمجموعة من خوارزميات التنقيب في البيانات Data Mining Algorithms فيما يتعلق بتحليل حوادث المرور، انطلاقاً من مرحلة إدخال البيانات، و ذلك من خلال تحليل بنية التقارير الإحصائية الموجودة في فرع مرور اللاذقية وصولاً إلى مرحل ة التنقيب في البيانات التي تستطيع إيجاد آلية قادرة على دراسة العوامل التي تلعب دوراً في حادث المرور بذكاء من أجل الربط و تحديد مدى العلاقة بينها و أهميتها في تسبب الحادث المروري، و ذلك بعد تصميم بنية مستودع البيانات على أساس قاعدة البيانات التي تم بناؤها لتخزين المعلومات، تم في هذا البحث ذكر مجموعة من النماذج التي تم اختبارها و التي تشكل عينة عن الاختبارات التي بنيت عليها نتائج البحث.
قواعد الارتباط هي حقل هام في التنقيب عن البيانات، و الذي يُستخدم لاكتشاف معرفة مفيدة من قواعد بيانات ضخمة. و تُستخدم قواعد الارتباط لاستخلاص معلومات من صفقات قواعد البيانات. و خوارزمية الأسبقية هي التطبيق العملي لقواعد الارتباط، و بدورها تُستخدم ل إيجاد مجموعات من البيانات المتكررة في صفقات قواعد البيانات. نقدّم في هذا البحث تحسيناً جديداً لخوارزمية الأسبقية بتخفيض توليد مجموعات بنود البيانات المُرشّحة مما يؤدي إلى زيادة فعّالية خوارزمية الأسبقية.
نقدم في بحثنا طريقة بسيطة, لتمييز صور المحارف المكتوبة يدوياً بالاعتماد على عمليات التنقيب التنبئي. و ذلؾ من خلال استخراج إحداثيات النقاط السوداء من صور المحارف الثنائية اللون (أسود, أبيض) المستخدمة في مراحل التدريب و الاختبار. و تخزينها في قاعدة بيانات, و فق بنية مناسبة لعمليات التنقيب التنبئي (بيانات تدريب و بيانات اختبار). و من ثم استخدام بيانات التدريب المستخرجة لبناء نموذج تنبئي يساعد على تمييز صور الاختبار, اعتماداً على خصائصها المستخرجة. و قد أجرينا عدة اختبارات على عينات مختلفة من صور المحارف المكتوبة يدوياً, و حصلنا على نتائج دقيقة, ضمن الشروط المطلوبة.
إن الهدفَ الرئيسي من عمليةِ التنقيب في البيانات هو استخراج المعلومات و اكتشاف المعرفةِ من قواعدِ البياناتِ الضخمة، حيث تُعتبر العنقدة أحد أهم الوظائف التي يمكن القيامَ بها في هذا المجال. يوجدُ العديدُ من طرقِ و خوارزمياتِ العنقدة، إلا أن تحديد أو تقدير عدد العناقيد التي يجبُ استخراجها من عينةٍ ما يعتبر من أهم القضايا التي تواجها معظمُ هذه الطرق. يركز هذا البحث على مسألةِ تقديرِ عدد العناقيد في حالةِ العنقدة الهرمية. نقَدم في هذا البحث تقييماً لثلاثةٍ من أكثرِ الطرقَ شيوعاً في تقديرِ عددِ العناقيد.
يعرض هذا البحث آليات تطبيق تقنيات التنقيب في المعطيات و حلول ذكاء الأعمال على المعطيات الموجودة ضمن مكتبة الجامعة العربية الدولية بعد ربطها بمعطيات الطلاب الموجودة ضمن النظام الأكاديمي الخاص بالجامعة، و الإجابة عن مجموعة من الأسئلة و الاستفسارات ا لتي من الممكن أن تؤثر في سير العمل ضمن المؤسسة التعليمية بوجه عام و ضمن مكتبة الجامعة بوجه خاص، و تقديم بعض الحلول لمساعدة المكتبة في تطوير خدماتها، و تطوير آليات العمل ضمنها، إضافة إلى تحديد بعض المؤشرات المتعلقة بدور موارد المعلومات في تطوير العملية التعليمية.
نقدم في هذا البحث خوارزمية جديدة لحل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات كالK-Means. هذه الخوارزمية الجديدة قادرة على عنقدة مجموعة من البيانات بشكل منفرد دون الحاجة لخوارزميات عنقدة أخرى.
يرمي البحث بشكل أساسي نحو تحقيق الأهداف الثلاثة التالية: - أولاً: دراسة و تحليل كل من فعاليتي تقييم أداء العاملين و التفقد اليومي في الجمهورية العربية السورية كنماذج لفعاليات الكوادر البشرية التي يمكن الاستفادة من بياناتها ضمن تطبيقات الذكاء الصنعي . - ثانياً: دراسة و تحليل آليات عمل أحد آليات الذكاء الصنعي و هي التنقيب في المعطيات و اختيار الأدوات المناسبة لمعالجة بيانات فعاليات الكوادر البشرية. - ثالثاً: اقتراح نموذج تطبيقي للإدارة الذكية للموارد البشرية يستند إلى التنقيب في المعطيات لمعالجة عينة البيانات التي تم جمعها بغية استكشاف المعرفة الكامنة داخل هذه المعطيات بما يدعم عملية اتخاذ القرارات المتعلقة بالكوادر البشرية في مؤسسات الجمهورية العربية السورية و من ثم مقارنة أداء التقنيات التي تم استخدامها و بيان مدى ملاءمتها لهذا النوع من المعطيات.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا