يصف هذا البحث نظاما للتعرف على الكلمة العربية المكتوبة بخط اليد دون تقطيع سابق للكلمة إلى محارف, و سيتم التعرف من خلاله على مستويين, و قد طور هذا النظام اعتمادا على نظام التعرف الضوئي على الحروف, و خوارزمية ماركوف المخفية, و عدد من التوابع (المورفولوجية), و خوارزميات استرجاع الصور اعتمادا على المحتوى.
This research describes a system for recognition of handwritten
Arabic word without prior segmentation of the word into characters.
In this system, the recognition will be happened at two levels.
It is evolved basing on OCR (Optical Character Recognition),
Hidden Markov Model, CBIR(Content Based Image Retrieval), it
also involves Mathematical Morphology.
Artificial intelligence review:
Research summary
يهدف هذا البحث إلى تطوير نظام للتعرف على الكلمات العربية المكتوبة بخط اليد دون الحاجة إلى تقسيمها إلى محارف فردية. يعتمد النظام على تقنيات التعرف الضوئي على الحروف (OCR)، ونموذج ماركوف المخفي (HMM)، واسترجاع الصور اعتماداً على المحتوى (CBIR)، بالإضافة إلى التوابع المورفولوجية. يتميز النظام بقدرته على التعامل مع التشوهات الطفيفة مثل الضجيج والدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد. تم بناء النظام باستخدام لغة البرمجة MATLAB (R2013a). يتكون النظام من مستويين للتعرف: المستوى الأول يعتمد على استخراج شعاع الخصائص للكلمة، بينما يستخدم المستوى الثاني نموذج ماركوف المخفي للتعرف على الكلمات المتشابهة في شعاع الخصائص. تم اختبار النظام على مجموعة من 50 كلمة عربية مخزنة في قاعدة بيانات، وحقق نسبة تعرف تصل إلى 98%. يمكن للنظام أيضاً إضافة كلمات جديدة إلى قاعدة البيانات للتعرف عليها لاحقاً.
Critical review
دراسة نقدية: يعتبر هذا البحث خطوة مهمة نحو تحسين تقنيات التعرف على النصوص العربية المكتوبة بخط اليد، وهو مجال يحتاج إلى مزيد من الاهتمام نظراً لتعقيد اللغة العربية وتنوع أشكال حروفها. ومع ذلك، يمكن تحسين البحث من خلال زيادة حجم قاعدة البيانات المستخدمة في الاختبارات لتشمل مجموعة أوسع من الكلمات والأنماط الكتابية. كما يمكن تعزيز النظام باستخدام تقنيات تعلم الآلة الحديثة مثل الشبكات العصبية العميقة التي قد توفر دقة أعلى في التعرف. بالإضافة إلى ذلك، يمكن تحسين واجهة المستخدم لتكون أكثر تفاعلية وسهولة في الاستخدام، مما يزيد من قابلية التطبيق في الحياة العملية.
Questions related to the research
-
ما هي التقنية الأساسية التي يعتمد عليها النظام في التعرف على الكلمات العربية المكتوبة بخط اليد؟
يعتمد النظام على تقنيات التعرف الضوئي على الحروف (OCR)، ونموذج ماركوف المخفي (HMM)، واسترجاع الصور اعتماداً على المحتوى (CBIR)، بالإضافة إلى التوابع المورفولوجية.
-
ما هي نسبة التعرف التي حققها النظام عند اختباره على مجموعة من الكلمات العربية؟
حقق النظام نسبة تعرف تصل إلى 98% عند اختباره على مجموعة من 50 كلمة عربية مخزنة في قاعدة بيانات.
-
ما هي اللغة البرمجية المستخدمة في بناء النظام؟
تم بناء النظام باستخدام لغة البرمجة MATLAB (R2013a).
-
كيف يتعامل النظام مع التشوهات الطفيفة مثل الضجيج والدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد؟
النظام غير حساس للتقييس، الضجيج المحدود، والتشوهات الخفيفة مثل الدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد.
References used
KURDY, M. B. 1993- Multifont Arabic/Latin Optical Character Recognition System, Congres international Langue arabe et technologies information avancees , December, 1993
VASELINA, J. 2006 -A bout some Application of Hidden Markov Model in intrusion detection system , international conference and computer systems and technologies, compsys tech 6
CONZALEZ R. ; WOODS, R. 2008 – Digital Image Processing. Person Education , 3d Edition
Designing Computerized Systems which posses reading and hearing
faculties is an active research area for more than four decades. Many
methods and algorithms have been suggested by researches for this
purpose as part of pattern recognition research
هدفنا من خلال هذه الدراسة في إطار المشروع الفصلي للسنة الرابعة إلى إلقاء الضوء على استرجاع الصور من مجموعة كبيرة بالاعتماد على محتوى صورة هدف , و قمنا بتدعيم هذه الدراسة بتطبيق ضمن بيئة الماتلاب لبرنامج بحث عن الصور المشابهة لصورة مدخلة .
و قد تركز
Content Based Medical Image Retrieval (CBMIR) systems are a new technique which researchers aim to integrate with Computer Aided Diagnosis systems. These systems usually find and retrieve images from a large image-database which have a similar conten
This research proposes a new way to improve the
search outcome of Arabic semantics by abstractly summarizing the
Arabic texts (Abstractive Summary) using natural language
processing algorithms(NLP),Word Sense Disambiguation (WSD)
and techniques o
Term and glossary management are vital steps of preparation of every language specialist, and they play a very important role at the stage of education of translation professionals. The growing trend of efficient time management and constant time con