ترغب بنشر مسار تعليمي؟ اضغط هنا

تعرف الكلمة العربية المكتوبة بخط اليد باستخدام استرجاع الصور اعتماداً على المحتوى

Arabic Handwritten Word Recognition using CBIR

1072   0   129   0 ( 0 )
 تاريخ النشر 2017
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يصف هذا البحث نظاما للتعرف على الكلمة العربية المكتوبة بخط اليد دون تقطيع سابق للكلمة إلى محارف, و سيتم التعرف من خلاله على مستويين, و قد طور هذا النظام اعتمادا على نظام التعرف الضوئي على الحروف, و خوارزمية ماركوف المخفية, و عدد من التوابع (المورفولوجية), و خوارزميات استرجاع الصور اعتمادا على المحتوى.


ملخص البحث
يهدف هذا البحث إلى تطوير نظام للتعرف على الكلمات العربية المكتوبة بخط اليد دون الحاجة إلى تقسيمها إلى محارف فردية. يعتمد النظام على تقنيات التعرف الضوئي على الحروف (OCR)، ونموذج ماركوف المخفي (HMM)، واسترجاع الصور اعتماداً على المحتوى (CBIR)، بالإضافة إلى التوابع المورفولوجية. يتميز النظام بقدرته على التعامل مع التشوهات الطفيفة مثل الضجيج والدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد. تم بناء النظام باستخدام لغة البرمجة MATLAB (R2013a). يتكون النظام من مستويين للتعرف: المستوى الأول يعتمد على استخراج شعاع الخصائص للكلمة، بينما يستخدم المستوى الثاني نموذج ماركوف المخفي للتعرف على الكلمات المتشابهة في شعاع الخصائص. تم اختبار النظام على مجموعة من 50 كلمة عربية مخزنة في قاعدة بيانات، وحقق نسبة تعرف تصل إلى 98%. يمكن للنظام أيضاً إضافة كلمات جديدة إلى قاعدة البيانات للتعرف عليها لاحقاً.
قراءة نقدية
دراسة نقدية: يعتبر هذا البحث خطوة مهمة نحو تحسين تقنيات التعرف على النصوص العربية المكتوبة بخط اليد، وهو مجال يحتاج إلى مزيد من الاهتمام نظراً لتعقيد اللغة العربية وتنوع أشكال حروفها. ومع ذلك، يمكن تحسين البحث من خلال زيادة حجم قاعدة البيانات المستخدمة في الاختبارات لتشمل مجموعة أوسع من الكلمات والأنماط الكتابية. كما يمكن تعزيز النظام باستخدام تقنيات تعلم الآلة الحديثة مثل الشبكات العصبية العميقة التي قد توفر دقة أعلى في التعرف. بالإضافة إلى ذلك، يمكن تحسين واجهة المستخدم لتكون أكثر تفاعلية وسهولة في الاستخدام، مما يزيد من قابلية التطبيق في الحياة العملية.
أسئلة حول البحث
  1. ما هي التقنية الأساسية التي يعتمد عليها النظام في التعرف على الكلمات العربية المكتوبة بخط اليد؟

    يعتمد النظام على تقنيات التعرف الضوئي على الحروف (OCR)، ونموذج ماركوف المخفي (HMM)، واسترجاع الصور اعتماداً على المحتوى (CBIR)، بالإضافة إلى التوابع المورفولوجية.

  2. ما هي نسبة التعرف التي حققها النظام عند اختباره على مجموعة من الكلمات العربية؟

    حقق النظام نسبة تعرف تصل إلى 98% عند اختباره على مجموعة من 50 كلمة عربية مخزنة في قاعدة بيانات.

  3. ما هي اللغة البرمجية المستخدمة في بناء النظام؟

    تم بناء النظام باستخدام لغة البرمجة MATLAB (R2013a).

  4. كيف يتعامل النظام مع التشوهات الطفيفة مثل الضجيج والدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد؟

    النظام غير حساس للتقييس، الضجيج المحدود، والتشوهات الخفيفة مثل الدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد.


المراجع المستخدمة
KURDY, M. B. 1993- Multifont Arabic/Latin Optical Character Recognition System, Congres international Langue arabe et technologies information avancees , December, 1993
VASELINA, J. 2006 -A bout some Application of Hidden Markov Model in intrusion detection system , international conference and computer systems and technologies, compsys tech 6
CONZALEZ R. ; WOODS, R. 2008 – Digital Image Processing. Person Education , 3d Edition
قيم البحث

اقرأ أيضاً

بناء حواسيب تستغني عن أدوات الإدخال محدودة الفضاء (مثل لوحة المفاتيح) وامتلاكها لمقدرة السمع و القراءة ظل من مجالات البحث النشطة في علوم الحاسوب , قدم فيها الباحثون عدد مقدر من الطرق و الخوارزميات لحوسبةالسمع و القراءة ضمن ما يعرف بالتعرف على الأنماط في علوم الحاسوب. ومن بين هذه الطرق الطريقة الشمولية (Holistic approach)، التي أثبتت كفاءتها في التعرف السريع (سمعاً أو قراءة) بالإضافة إلي مفهوم التعلم العميق الذي يعتبر ثورة في مجال تعلم الآلة في الوقت الحالي,وزاد الإهتمام به حديثاً خصوصاً بعد الزيادة الكبيرة في سرعة المعالجة الحاسوبية و التقدم في المعالجة المتوازية. هذه الدراسة تقدم تجارب إدراك ناجحة للشبكات العصبية العميقة في التعرف شمولياً على الأسماء العربية الأكثر شيوعاً، حيث تم إستخدام أدوات التعلم العميق و تمت تجربتها على السبعة أسماءالاكثر شيوعا بحسب مجموعة بيانات جامعة السودان للاسماء (SUST-ARG names) وبعد إجراء مراحل التدريب الخمسة , إستطاعت الشبكة أن تتعرف علي كل الأسماء وبنسبة 100% .
هدفنا من خلال هذه الدراسة في إطار المشروع الفصلي للسنة الرابعة إلى إلقاء الضوء على استرجاع الصور من مجموعة كبيرة بالاعتماد على محتوى صورة هدف , و قمنا بتدعيم هذه الدراسة بتطبيق ضمن بيئة الماتلاب لبرنامج بحث عن الصور المشابهة لصورة مدخلة . و قد تركز بحثنا على ميزتين هامتين يكاد لا يخلو منها أي نظام بحث عن الصور بالاعتماد على المحتوى و هما ميزتي الهيستوغرام اللوني و بنية الصورة texture , ووضحنا الخطوات التي يتم في ضوئها عملية الاسترجاع بدءاً من تحليل الصورة و استخلاص شعاع الواصفات الخاص فيها , و مطابقته مع أشعة الميزات الخاصة بالصور الموجودة في قاعدة البيانات ليتم ترتيب الصور بحسب مدى تشابهها من الصورة الهدف . و تطرقت الدراسة إلى استخدام الفضاء اللوني HMMD كبديل للفضاء اللوني RGB لاستخراج واصفات البنية اللونية على اعتبار أنه نموذج لوني موجه بالمستخدم user oriented و بالتالي نضمن أن نحصل على نتائج أفضل ترضي المستخدم . وقمنا بتدعيم الدراسة بعدد من الأشكال و الأمثلة و المخططات التي توضح محتوى الدراسة النظرية و ما قمنا بعمله في التطبيق ضمن بيئة الماتلاب .
تعد أنظمة استرجاع الصور الطبية اعتماداً على المحتوى من التقنيات الحديثة التي يسعى الباحثون إلى تكاملها مع أنظمة التشخيص بمساعدة الحاسوب. تقوم هذه الأنظمة أساساً بإيجاد صور في قاعدة بيانات تضم مجموعة كبيرة من الصور ذات محتوى مشابه لصورة استعلام معينة. يجري الاستعلام عن طريق استخلاص الخصائص البصرية للصورة المعينة و صياغتها في متجه خصائص تَُقارن مكوناته بمتجهات الخصائص للصور الموجودة في قاعدة البيانات و يقاس التشابه، و من ثم تسَترجع الصور التي لها محتوى مشابه لصورة الاستعلام. تقدم هذه الورقة تقييماً للوضع الراهن لأنظمة استرجاع الصور الطبية اعتماداً على المحتوى بناء على دراسة تحليلية للبحوث الحديثة المنشورة، و تخلص إلى استنتاج اتجاهات بحثية محددة في هذا المجال.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.
تتمثل إدارة المصطلح والمصطلان بخطوات حيوية لإعداد كل أخصائي لغة، ولعب دورا مهما للغاية في مرحلة تعليم محترفي الترجمة.يتزايد الاتجاه المتزايد من إدارة الوقت الفعالة والقيود الزمنية المستمرة التي قد نلاحظها في كل قطاع عمل بزيادة ضرورة تجميع المسرد التل قائي.تعتمد العديد من أنظمة AET ثنائية اللغة أداء جيدا على معالجة البيانات الموازية، ومع ذلك، فإن هذه الشركات الموازية ليست متاحة دائما لمجال معين أو زوج لغة.يعد الوصول إلى المجال الخاص، والوصول ثنائي اللغة إلى المعلومات واسترجاعه بناء على شركة Corpora المقارنة مجالا واعدةا كبيرا من البحث يتطلب تحليلا مفصلا لكلا من مصادر البيانات المتوفرة وتقنيات الاستخراج المحتملة.يركز هذا العمل على استخراج المصطلحات التلقائية الخاصة بالمجال من شركة Corga المقارنة للزوج باللغة الإنجليزية - اللغة الروسية من خلال الاستفادة من تضمين الكلمات العصبية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا