ترغب بنشر مسار تعليمي؟ اضغط هنا

استخدام التنقيب في البيانات لمساعدة الآلة في تمييز المحارف المكتوبة يدوياً

Using Data Mining To Help Machine In Handwriting Characters Recognition

1699   6   35   0 ( 0 )
 تاريخ النشر 2016
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم في بحثنا طريقة بسيطة, لتمييز صور المحارف المكتوبة يدوياً بالاعتماد على عمليات التنقيب التنبئي. و ذلؾ من خلال استخراج إحداثيات النقاط السوداء من صور المحارف الثنائية اللون (أسود, أبيض) المستخدمة في مراحل التدريب و الاختبار. و تخزينها في قاعدة بيانات, و فق بنية مناسبة لعمليات التنقيب التنبئي (بيانات تدريب و بيانات اختبار). و من ثم استخدام بيانات التدريب المستخرجة لبناء نموذج تنبئي يساعد على تمييز صور الاختبار, اعتماداً على خصائصها المستخرجة. و قد أجرينا عدة اختبارات على عينات مختلفة من صور المحارف المكتوبة يدوياً, و حصلنا على نتائج دقيقة, ضمن الشروط المطلوبة.


ملخص البحث
يتناول هذا البحث الذي أعده الطالب بسام الديب بإشراف أ.د. مهند رجب ود. زكريا زكريا من جامعة البعث، استخدام تقنيات التنقيب في البيانات لتحسين تمييز المحارف المكتوبة يدوياً. يوضح البحث أن تمييز المحارف بصرياً (OCR) قد حقق تقدماً كبيراً، ولكنه لا يزال يواجه تحديات كبيرة عند التعامل مع الكتابات اليدوية وكتابات الأطفال بسبب التنوع الكبير في الأشكال والأحجام. يقدم البحث طريقة جديدة تعتمد على استخراج إحداثيات النقاط السوداء من صور المحارف الثنائية اللون (أسود وأبيض) وتخزينها في قاعدة بيانات. يتم استخدام هذه البيانات لبناء نموذج تنبؤي يساعد في تمييز صور الاختبار. استخدم الباحثون خوارزمية التصنيف البيزياني البسيط لاختبار فعالية الطريقة المقترحة، وحققوا نتائج دقيقة ضمن الشروط المطلوبة. يهدف البحث إلى دراسة فعالية عمليات التنقيب التنبئي لاستخراج المعرفة من كميات البيانات الضخمة باستخدام خصائص مستخرجة من صور المحارف المكتوبة يدوياً. كما يهدف إلى تقديم طريقة جديدة وبسيطة لتمييز هذه الصور، مما قد يقود إلى أبحاث مستقبلية أكثر تطوراً في هذا المجال.
قراءة نقدية
دراسة نقدية: بالرغم من أن البحث يقدم طريقة مبتكرة ومبسطة لتمييز المحارف المكتوبة يدوياً باستخدام تقنيات التنقيب في البيانات، إلا أنه يواجه بعض التحديات. أولاً، الاعتماد على خصائص محددة مثل إحداثيات النقاط السوداء قد يكون محدوداً في التعامل مع التنوع الكبير في الكتابات اليدوية. ثانياً، استخدام خوارزمية التصنيف البيزياني البسيط قد لا يكون كافياً للتعامل مع التعقيدات الكبيرة في الكتابات اليدوية المتنوعة. ثالثاً، البحث لم يتناول بشكل كافٍ كيفية التعامل مع الضجيج في البيانات أو كيفية تحسين جودة الصور المدخلة. وأخيراً، قد يكون من المفيد توسيع نطاق البحث ليشمل تقنيات تعلم الآلة الأكثر تطوراً مثل الشبكات العصبية العميقة لتحسين دقة التمييز.
أسئلة حول البحث
  1. ما هي التحديات الرئيسية التي تواجه تمييز المحارف المكتوبة يدوياً؟

    التحديات الرئيسية تشمل التنوع الكبير في الأشكال والأحجام للكتابات اليدوية، والتعامل مع الضجيج في البيانات، والحاجة إلى أنظمة مراقبة وإشراف عالية المستوى.

  2. ما هي الطريقة المقترحة في البحث لتمييز المحارف المكتوبة يدوياً؟

    الطريقة المقترحة تعتمد على استخراج إحداثيات النقاط السوداء من صور المحارف الثنائية اللون وتخزينها في قاعدة بيانات، ثم استخدام هذه البيانات لبناء نموذج تنبؤي يساعد في تمييز صور الاختبار.

  3. ما هي الخوارزمية المستخدمة في البحث لاختبار فعالية الطريقة المقترحة؟

    استخدم الباحثون خوارزمية التصنيف البيزياني البسيط لاختبار فعالية الطريقة المقترحة.

  4. ما هي النتائج التي حققها البحث باستخدام الطريقة المقترحة؟

    حقق البحث نتائج دقيقة في تمييز المحارف المكتوبة يدوياً ضمن الشروط المطلوبة، مما يدل على فعالية الطريقة المقترحة.


المراجع المستخدمة
AGGARWAL, CH ,2014–Data Classification Algorithms and Applications. First Edition, Taylor & Francis Group, LLC, New York, USA,64P
ALPAYDIN, E, 2010-Introduction to Machine Learning. Second Edition, Cambridge, Massachusetts London, England, 579p
BARBER,D,2010-Bayesian Reasoning and Machine Learning. First Edition, Cambridge University Press, London, England, 610p
قيم البحث

اقرأ أيضاً

يهدف التنقيب عن البيانات التعليمية إلى دراسة البيانات المتوفرة في المجال التعليمي وإخراج المعرفة المخفية منه بغية الاستفادة منها في تعزيز عملية التعليم واتخاذ قرارات ناجحة من شأنها تحسين الأداء الأكاديمي للطالب. تقترح هذه الدراسة استخدام تقنيات التنق يب عن البيانات لتحسين التنبؤ بأداء الطلاب، حيث تم تطبيق ثلاث خوارزميات تصنيف Naïve Bayes, J48, Support Vector Machine)) على قاعدة بيانات أداء الطلاب ، ثم تم تصميم مصنف جديد لدمج نتائج تلك المصنفات الفردية باستخدام تقنية الدمج Voting Method . تم استخدام الأداة WEKAالتي تدعم الكثير من خوارزميات و طرائق التنقيب في البيانات. تظهر النتائج أن مصنف الدمج لديه أعلى دقة للتنبؤ بمستويات الطلاب مقارنة بالمصنفات الأخرى ، حيث حقق دقة تعرف وصلت إلى74.8084 % . و أفادت خوارزمية العنقدةsimple k-means في تجميع الطلاب المتشابهين في مجموعات منفصلة بالتالي فهم مميزات كل مجموعة مما يساعد على قيادة وتوجيه كل مجموعة على حدى.
تقدم هذه الورقة البحثية مقارنة لمجموعة من خوارزميات التنقيب في البيانات Data Mining Algorithms فيما يتعلق بتحليل حوادث المرور، انطلاقاً من مرحلة إدخال البيانات، و ذلك من خلال تحليل بنية التقارير الإحصائية الموجودة في فرع مرور اللاذقية وصولاً إلى مرحل ة التنقيب في البيانات التي تستطيع إيجاد آلية قادرة على دراسة العوامل التي تلعب دوراً في حادث المرور بذكاء من أجل الربط و تحديد مدى العلاقة بينها و أهميتها في تسبب الحادث المروري، و ذلك بعد تصميم بنية مستودع البيانات على أساس قاعدة البيانات التي تم بناؤها لتخزين المعلومات، تم في هذا البحث ذكر مجموعة من النماذج التي تم اختبارها و التي تشكل عينة عن الاختبارات التي بنيت عليها نتائج البحث.
تتكرر تأخيرات الرحلات الجوية في جميع أنحاء العالم (حوالي 20٪ من رحلات الطيران تصل متأخرة أكثر من 15 دقيقة) وتقدر كلفتها السنوية بعشرات المليارات من الدولارات. يجعل هذا السيناريو التنبؤ بتأخيرات الرحلة قضية أساسية لشركات الطيران والمسافرين. الهدف الرئ يسي من هذا العمل هو تطبيق تنبؤ بتأخير وصول رحلة مجدولة تبعاً للظروف الجوية. يأخذ تأخير الوصول المتوقع في الاعتبار كلاً من معلومات الرحلة (المطار الأصلي ، مطار الوجهة ، وقت المغادرة ووقت الوصول) وأحوال الطقس في المطار الأصلي والمطار المقصود وفقًا لجدول الرحلة. تم تحليل الرحلات الجوية ومجموعات المعطيات الخاصة بالملاحظات الجوية باستخدام الخوارزميات المتوازية المطبقة في برنامج MapReduce المنفّذ على منصّة سحابية. تظهر النتائج دقة عالية في التنبؤ بالتأخيرات مع عتبة معينة. على سبيل المثال ، مع عتبة تأخير مدتها 15 دقيقة ، نحقق دقة تبلغ 74.2 ٪ و 71.8 ٪ من التذكر recall على الرحلات المتأخرة ، بينما مع عتبة 60 دقيقة ، كانت الدقة 85.8 ٪ ، وتذكّر التأخر هو 86.9 ٪. علاوة على ذلك ، توضح النتائج التجريبية قابلية التوسّع للمتنبئ التي يمكن تحقيقها أثناء أداء مهام إعداد المعطيات والتنقيب بها كتطبيقات MapReduce على السحابة.
التطورات في احتساب دقة الموقع الجغرافي والحوسبة المتنقلة ولدت كمية ضخمة من البيانات عن المسارات المكانية والتي تمثل المسارات الحركية لأغراض متنوعة متحركة مثل: اشخاص، مركبات، حيوانات، تم طرح العديد من التقنيات لمعالجة وادارة وتعدين هذه المعلومات في ال عقود الماضية من اجل تعزيز مجال واسع من التطبيقات، في هذا المقال، سنجري بشكل رئيسي مسحاً منهجياً على دراسة تعدين البيانات، سنقدم نظرة عامة عن هذا المجال والعناوين الرئيسية عن مواضيع البحث، وذلك باتباع خطة تبدأمن اشتقاق بيانات المسار ومن ثم تجهيزها (preprocessing) الى ادارتها لتنتهي بعدد من مهام التعدين ( تعدين انماط المسارات، الكشف الخارجي، تصنيف المسار)، هذه الدراسة تبحث في الاتصالات، الارتباطات، والاختلافات بين التقنيات الموجودة، كما يقدم الطرق التي تحول المسارات الى بنية بيانات أخرى، مثل: رسومات بيانية، مصفوفات، tensors ، حيث يمكننا زيادة عدد تقنيات التعدين والتعلم الآلي التي يمكن تطبيقها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا