ترغب بنشر مسار تعليمي؟ اضغط هنا

يهدف التنقيب عن البيانات التعليمية إلى دراسة البيانات المتوفرة في المجال التعليمي وإخراج المعرفة المخفية منه بغية الاستفادة منها في تعزيز عملية التعليم واتخاذ قرارات ناجحة من شأنها تحسين الأداء الأكاديمي للطالب. تقترح هذه الدراسة استخدام تقنيات التنق يب عن البيانات لتحسين التنبؤ بأداء الطلاب، حيث تم تطبيق ثلاث خوارزميات تصنيف Naïve Bayes, J48, Support Vector Machine)) على قاعدة بيانات أداء الطلاب ، ثم تم تصميم مصنف جديد لدمج نتائج تلك المصنفات الفردية باستخدام تقنية الدمج Voting Method . تم استخدام الأداة WEKAالتي تدعم الكثير من خوارزميات و طرائق التنقيب في البيانات. تظهر النتائج أن مصنف الدمج لديه أعلى دقة للتنبؤ بمستويات الطلاب مقارنة بالمصنفات الأخرى ، حيث حقق دقة تعرف وصلت إلى74.8084 % . و أفادت خوارزمية العنقدةsimple k-means في تجميع الطلاب المتشابهين في مجموعات منفصلة بالتالي فهم مميزات كل مجموعة مما يساعد على قيادة وتوجيه كل مجموعة على حدى.
تحظى الأبحاث حول البيانات الضخمة باهتمام العديد من العلماء.حيث أن هناك العديد من الحلول لمشاكل التكتل الشائعة ، ولكن تكتل البيانات الكبيرة بدأ الاهتمام به حديثاً. في هذه الورقة البحثية، تم أقتراح حلاً لتكتل البيانات الكبيرة عن طريق تقليل الميزات من خ لال طريقة جديدة في تقليل الأبعاد استناداً إلى Johnson Lindenstraus lemma ثم تقسيم البيانات إلى مجموعات صغيرة ثم تجميعها محلياً وأخيراً تكتيل المجموعات .(BDC-RPFR & CFCM) تظهر الاختبارات أن استخدام هذه الطريقة يعطي نتائج وأداء أفضل.
اختيار الطريقة المناسبة لتجزيء مجموعة من البيانات الكبيرة والتي تصف مجموعة من الخصائص الخاصة بمجال معين الى عناقيد (مجموعات) والمقارنة بين الطرق المختلفة للعنقدة بتجزيء الفضاء من حيث الإيجابيات والسلبيات وعرض التطبيقات المختلفة عليها واستخداماتها
إن البيئة الإفتراضية هي البنية الأساسية و المكون الأهم من مكونات الحوسبة السحابية و نظرا لما تقدمه البيئة الإفتراضية من ميزات لا تقدمها البيئات غير الإفتراضية من مرونة و توفير للطاقة و التكلفة و الاستخدام الأمثل للموارد جعل معظم شركات الاعمال و الحكو مات تتجه لتحميل خدماتها و تطبيقاتها على مخدمات افتراضية بدلا من المخدمات الفيزيائية و من هذا المنطلق اتجه الباحثون لمقارنة اداء البيئات الإفتراضية المختلفة بهدف الحصول على أفضل بيئة ممكنة ليتم استخدامها في الحوسبة السحابية و تحقيق الحوسبة عالية الأداء. تم تقييم تأثير البيئة الافتراضية على "الحوسبة عالية الأداء كخدمة و ذلك من خلال تغيير نوع البيئة الإفتراضية المستخدمة كبنية تحتية في الحوسبة السحابية . تم استخدام البيئة الإفتراضية XEN-PV( XEN Paravirtualization ) كبنية تحتية للحوسبة عالية الأداء و من ثم البيئة الإفتراضية (XEN-Hardware virtual machine) XEN-HVM حيث أن ال XEN هو ال hypervisor الأساسي لشركة Citrix و هي شركة رائدة في تطوير البيئات الإفتراضية و تم تقيم الأداء عند استخدام نظام التخزين التكراري المتماثل DRBD (Distributed Replicated Block Device ) كجهاز تخزين مشترك للأقراص الإفتراضية في العنقود. إن نتائج هذا البحث تثبت أن تقنية البيئة الافتراضية و مخطط العنقدة المستخدم لهما دور مهم في تحسين أداء "الحوسبة عالية الأداء".
نقدم في هذا البحث خوارزمية جديدة لحل بعض المشاكل التي تعاني منها خوارزميات عنقدة البيانات كالK-Means. هذه الخوارزمية الجديدة قادرة على عنقدة مجموعة من البيانات بشكل منفرد دون الحاجة لخوارزميات عنقدة أخرى.
نتيجةً للتطور الهائل في العلوم والتكنولوجيا، والانتشار الواسع للإنترنت، باتت المعرفة البشرية في متناول كل شخص منا. لكن ومع هذا الكم الهائل من المعلومات، اصبح القارئ مشتتا بين مصادر عديدة تجعله يضيع في هذا الفضاء الواسع. انفجار المعلومات هذا تطلب وسائ ل للسيطرة عليه تقوم بتنظيم هذه المعلومات وترتيبها تحت عناوين عريضة، وتتتبعها. من هنا بدء المجتمع التقني بالاتجاه نحو مجال جديد اطلق عليه اسم اكتشاف الموضوع وتتبعه. يطبق هذا المفهوم بشكل واسع في مجال شبكات التواصل الاجتماعي، الاخبار، المقالات العلمية وغيرها الكثير. ففي مجال الاخبار كثيرا ما ترى آلاف وكالات الاخبار تبث عشرات الاف القصص الاخبارية حول نفس الحدث، ما دفع البوابات الاخبارية وفي مقدمتها Google news لتطبيق نظام اكتشاف للموضوع وتتبعه. يعنى هذا النظام بمجموعة من المهام المعرفة من قبل منظمة DARPA، أولها مراقبة سيل من القصص النصية المتصلة لمعرفة الحدود الفاصلة بين كل قصة والاخرى، وتدعى تقطيع القصص، ثانيها مهمتها الاجابة على السؤال: هل تناقش قصتان معطاتان نفس الموضوع او الحدث؟ وتدعى اكتشاف الصلة. ثالثها معنية بمراقبة سيل من القصص لاكتشاف تلك التي تناقش موضوعا معرفا من قبل المستخدم، وتدعى بتتبع الموضوع. رابعها تهتم بالتعرف على القصص التي تناقش احداثا جديدة فور وصولها، وتدعى اكتشاف القصة الاولى. واخرها تدعى اكتشاف الموضوع، وهي مسؤولة عن فصل مجموعة من القصص المختلطة الى مواضيع، بدون اي معرفة مسبقة بهذه المواضيع، اي تجميع القصص التي تناقش موضوعا واحدا في نفس العنقود. نعمل من خلال هذا المشروع على تطبيق المهام الاربع الاخيرة وتقييمها. يتم استلام القصص في الزمن الحقيقي، اجراء معالجة مسبقة عليها (معالجة لغوية وغير ذلك)، ثم يتم تمثيل القصص بشكل اشعة وتوزين كلمات كل قصة، يتم بعدها اختيار مجموعة كلمات لتمثيل القصة. اما تمثيل المواضيع فنختبر اشكالا مختلفة، كالتمثيل الشعاعي او التمثيل بالقصص وغير ذلك. نناقش خلال هذا المشروع ايضاً استخدام معايير مختلفة لتمثيل القصص وقياس تشابهها، ونختبر استخدام عنوان القصة وتاريخها كمميزات بالإضافة الى مجموعة الكلمات. كما ونتحدث عن منهج خاص بنا لتقييس التشابهات بين القصص والتخفيف من تأثير عمليات اختيار العتبات في النظام، ونعرض التحسينات المذهلة التي يبديها هذا المنهج، والتي تمكن من بناء نظام اكتشاف موضوع وتتبعه، دون القلق حول تحديد العتبة اطلاقا، والذي لطالما كان يمثل التحدي الاكبر لهذا النوع من الانظمة. نتحدث عن تطبيقنا لخوارزميات العنقدة الاكثر تطورا في مهمة اكتشاف الموضوع، ونعرض كيفية قيامنا بتعديل مصفوفة التجاذب في خوارزمية العنقدة الطيفية المطروحة واستخدام طريقة تقييس مختلفة تم تكييفها مع حالة نظامنا، والتي ادت الى تحسين اداء العنقدة من 0.89 الى 0.97 مقاسا على F-measure
إن الهدفَ الرئيسي من عمليةِ التنقيب في البيانات هو استخراج المعلومات و اكتشاف المعرفةِ من قواعدِ البياناتِ الضخمة، حيث تُعتبر العنقدة أحد أهم الوظائف التي يمكن القيامَ بها في هذا المجال. يوجدُ العديدُ من طرقِ و خوارزمياتِ العنقدة، إلا أن تحديد أو تقدير عدد العناقيد التي يجبُ استخراجها من عينةٍ ما يعتبر من أهم القضايا التي تواجها معظمُ هذه الطرق. يركز هذا البحث على مسألةِ تقديرِ عدد العناقيد في حالةِ العنقدة الهرمية. نقَدم في هذا البحث تقييماً لثلاثةٍ من أكثرِ الطرقَ شيوعاً في تقديرِ عددِ العناقيد.
يهدف البحث إلى تطوير طريقة جديدة لاستخراج و تحديد خصائص و سمات الأورام السرطانية في صور المرنان المغناطيسي للثدي بالإعتماد خوارزميات العنقدة و معالجة الصور الرقمية ,تم في البداية الاعتماد على إحدى خوارزميات العنقدة فيتجزئة الصورة و تجميع عناصرها و فق قيم السويات الرمادية و من ثم تم تطبيق العمليات المورفولوجية و ذلك للتخلص من الضجيج و حذف المعلومات غير المرغوبة و بالتالي استخراج المنطقة المشبوهة و أخيراً تم استخلاص بعض الواصفات الشكلية و التي يمكن ان تكون مفيدة في تشخيص المنطقة المشبوهة المستخرجة ,استخدمت قاعدة بيانات مكونة من 96 صورة من صور المرنان المغناطيسي للثدي و تم تطبيق الطريقة المقترحة عليها باستخدام برنامج الماتلاب حيث تم استخراج المناطق الورمية من هذه الصور و مقارنتها مع رأي الأطباء.
تعد بروتوكولات التوجيه الهرمية المعتمدة على العنقدة الديناميكية إحدى الطرق المستخدمة لحفظ الطاقة و إطالة زمن حياة شبكات الحساسات اللاسلكية، إلا أن أغلب الأبحاث تقوم بإهمال الطاقة المستهلكة خلال عمليتي انتخاب الرؤوس و تشكيل العناقيد في الشبكة. قمنا ف ي هذا البحث بدراسة طاقة الحمل الزائد الذي تتسبب به بروتوكولات التوجيه الهرمية المعتمدة على العنقدة الديناميكية كالبروتوكول LEACH، و دراسة أثره على فترة الاستقرار في شبكات الحساسات اللاسلكية. كما تم اقتراح حل للحد من استهلاك هذه الطاقة و ذلك من خلال تقليل الطاقة المستهلكة في عمليتي العنقدة و انتخاب الرؤوس. تبين لنا من خلال نتائج المحاكاة أن الطاقة المستهلكة في مرحلة الإعداد للبروتوكول LEACH تُنقِص من فترة الاستقرار و تزيد من عدد العقد الميتة في شبكات الحساسات اللاسلكية، و أن استخدام الحل المقترح قد عمل على الحد من استهلاك الطاقة أثناء عملية انتخاب الرؤوس و تشكيل العناقيد بشكل واضح مقارنةً بالطريقة العادية المتبعة في البروتوكول LEACH، مما زاد من فترة الاستقرار و عدد العقد الحية في الشبكة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا