Do you want to publish a course? Click here

Arabic Handwritten Word Recognition using CBIR

تعرف الكلمة العربية المكتوبة بخط اليد باستخدام استرجاع الصور اعتماداً على المحتوى

1074   0   129   0 ( 0 )
 Publication date 2017
and research's language is العربية
 Created by Shamra Editor




Ask ChatGPT about the research

This research describes a system for recognition of handwritten Arabic word without prior segmentation of the word into characters. In this system, the recognition will be happened at two levels. It is evolved basing on OCR (Optical Character Recognition), Hidden Markov Model, CBIR(Content Based Image Retrieval), it also involves Mathematical Morphology.


Artificial intelligence review:
Research summary
يهدف هذا البحث إلى تطوير نظام للتعرف على الكلمات العربية المكتوبة بخط اليد دون الحاجة إلى تقسيمها إلى محارف فردية. يعتمد النظام على تقنيات التعرف الضوئي على الحروف (OCR)، ونموذج ماركوف المخفي (HMM)، واسترجاع الصور اعتماداً على المحتوى (CBIR)، بالإضافة إلى التوابع المورفولوجية. يتميز النظام بقدرته على التعامل مع التشوهات الطفيفة مثل الضجيج والدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد. تم بناء النظام باستخدام لغة البرمجة MATLAB (R2013a). يتكون النظام من مستويين للتعرف: المستوى الأول يعتمد على استخراج شعاع الخصائص للكلمة، بينما يستخدم المستوى الثاني نموذج ماركوف المخفي للتعرف على الكلمات المتشابهة في شعاع الخصائص. تم اختبار النظام على مجموعة من 50 كلمة عربية مخزنة في قاعدة بيانات، وحقق نسبة تعرف تصل إلى 98%. يمكن للنظام أيضاً إضافة كلمات جديدة إلى قاعدة البيانات للتعرف عليها لاحقاً.
Critical review
دراسة نقدية: يعتبر هذا البحث خطوة مهمة نحو تحسين تقنيات التعرف على النصوص العربية المكتوبة بخط اليد، وهو مجال يحتاج إلى مزيد من الاهتمام نظراً لتعقيد اللغة العربية وتنوع أشكال حروفها. ومع ذلك، يمكن تحسين البحث من خلال زيادة حجم قاعدة البيانات المستخدمة في الاختبارات لتشمل مجموعة أوسع من الكلمات والأنماط الكتابية. كما يمكن تعزيز النظام باستخدام تقنيات تعلم الآلة الحديثة مثل الشبكات العصبية العميقة التي قد توفر دقة أعلى في التعرف. بالإضافة إلى ذلك، يمكن تحسين واجهة المستخدم لتكون أكثر تفاعلية وسهولة في الاستخدام، مما يزيد من قابلية التطبيق في الحياة العملية.
Questions related to the research
  1. ما هي التقنية الأساسية التي يعتمد عليها النظام في التعرف على الكلمات العربية المكتوبة بخط اليد؟

    يعتمد النظام على تقنيات التعرف الضوئي على الحروف (OCR)، ونموذج ماركوف المخفي (HMM)، واسترجاع الصور اعتماداً على المحتوى (CBIR)، بالإضافة إلى التوابع المورفولوجية.

  2. ما هي نسبة التعرف التي حققها النظام عند اختباره على مجموعة من الكلمات العربية؟

    حقق النظام نسبة تعرف تصل إلى 98% عند اختباره على مجموعة من 50 كلمة عربية مخزنة في قاعدة بيانات.

  3. ما هي اللغة البرمجية المستخدمة في بناء النظام؟

    تم بناء النظام باستخدام لغة البرمجة MATLAB (R2013a).

  4. كيف يتعامل النظام مع التشوهات الطفيفة مثل الضجيج والدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد؟

    النظام غير حساس للتقييس، الضجيج المحدود، والتشوهات الخفيفة مثل الدوران والانحراف عن الخط الناتج عن الكتابة بخط اليد.


References used
KURDY, M. B. 1993- Multifont Arabic/Latin Optical Character Recognition System, Congres international Langue arabe et technologies information avancees , December, 1993
VASELINA, J. 2006 -A bout some Application of Hidden Markov Model in intrusion detection system , international conference and computer systems and technologies, compsys tech 6
CONZALEZ R. ; WOODS, R. 2008 – Digital Image Processing. Person Education , 3d Edition
rate research

Read More

Designing Computerized Systems which posses reading and hearing faculties is an active research area for more than four decades. Many methods and algorithms have been suggested by researches for this purpose as part of pattern recognition research . Recently, more research work has been devoted to the holist approach the recognition system recognizes a complete word as one object without going through the long and erroneous character segmentation process. In this paper, a convolutional neural network has been designed to recognize the popular Arabic names holistically. SUSt ARG names data set has been used to test the network performance (collected and compiled by pattern recognition research in Sudan University of Science and Technology-SUSt). Selecting an appropriate deep learning toolbox, after five stages of training, the network was able to recognize all the names and 100%
هدفنا من خلال هذه الدراسة في إطار المشروع الفصلي للسنة الرابعة إلى إلقاء الضوء على استرجاع الصور من مجموعة كبيرة بالاعتماد على محتوى صورة هدف , و قمنا بتدعيم هذه الدراسة بتطبيق ضمن بيئة الماتلاب لبرنامج بحث عن الصور المشابهة لصورة مدخلة . و قد تركز بحثنا على ميزتين هامتين يكاد لا يخلو منها أي نظام بحث عن الصور بالاعتماد على المحتوى و هما ميزتي الهيستوغرام اللوني و بنية الصورة texture , ووضحنا الخطوات التي يتم في ضوئها عملية الاسترجاع بدءاً من تحليل الصورة و استخلاص شعاع الواصفات الخاص فيها , و مطابقته مع أشعة الميزات الخاصة بالصور الموجودة في قاعدة البيانات ليتم ترتيب الصور بحسب مدى تشابهها من الصورة الهدف . و تطرقت الدراسة إلى استخدام الفضاء اللوني HMMD كبديل للفضاء اللوني RGB لاستخراج واصفات البنية اللونية على اعتبار أنه نموذج لوني موجه بالمستخدم user oriented و بالتالي نضمن أن نحصل على نتائج أفضل ترضي المستخدم . وقمنا بتدعيم الدراسة بعدد من الأشكال و الأمثلة و المخططات التي توضح محتوى الدراسة النظرية و ما قمنا بعمله في التطبيق ضمن بيئة الماتلاب .
Content Based Medical Image Retrieval (CBMIR) systems are a new technique which researchers aim to integrate with Computer Aided Diagnosis systems. These systems usually find and retrieve images from a large image-database which have a similar conten t to a query image. Retrieval is done by extracting the visual features from the query image, formulating them in a features vector, comparing features vector components with those of the images in the database, and then, similarity measures are computed. Based on the similarity measures, images which have a similar content to the query image are retrieved. The introduced analysis study surveys and analyzes the current status of the CBMIR systems, evaluates our findings from this survey, and concludes some specific research directions in this field.
Term and glossary management are vital steps of preparation of every language specialist, and they play a very important role at the stage of education of translation professionals. The growing trend of efficient time management and constant time con straints we may observe in every job sector increases the necessity of the automatic glossary compilation. Many well-performing bilingual AET systems are based on processing parallel data, however, such parallel corpora are not always available for a specific domain or a language pair. Domain-specific, bilingual access to information and its retrieval based on comparable corpora is a very promising area of research that requires a detailed analysis of both available data sources and the possible extraction techniques. This work focuses on domain-specific automatic terminology extraction from comparable corpora for the English -- Russian language pair by utilizing neural word embeddings.

suggested questions

comments
Fetching comments Fetching comments
Sign in to be able to follow your search criteria
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا