ترغب بنشر مسار تعليمي؟ اضغط هنا

تعرف الكلمة العربية المكتوبة بخط اليد باستخدام استرجاع الصور اعتماداً على المحتوى

Arabic Handwritten Word Recognition using CBIR

874   0   129   0 ( 0 )
 تاريخ النشر 2017
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يصف هذا البحث نظاما للتعرف على الكلمة العربية المكتوبة بخط اليد دون تقطيع سابق للكلمة إلى محارف, و سيتم التعرف من خلاله على مستويين, و قد طور هذا النظام اعتمادا على نظام التعرف الضوئي على الحروف, و خوارزمية ماركوف المخفية, و عدد من التوابع (المورفولوجية), و خوارزميات استرجاع الصور اعتمادا على المحتوى.

المراجع المستخدمة
KURDY, M. B. 1993- Multifont Arabic/Latin Optical Character Recognition System, Congres international Langue arabe et technologies information avancees , December, 1993
VASELINA, J. 2006 -A bout some Application of Hidden Markov Model in intrusion detection system , international conference and computer systems and technologies, compsys tech 6
CONZALEZ R. ; WOODS, R. 2008 – Digital Image Processing. Person Education , 3d Edition
قيم البحث

اقرأ أيضاً

بناء حواسيب تستغني عن أدوات الإدخال محدودة الفضاء (مثل لوحة المفاتيح) وامتلاكها لمقدرة السمع و القراءة ظل من مجالات البحث النشطة في علوم الحاسوب , قدم فيها الباحثون عدد مقدر من الطرق و الخوارزميات لحوسبةالسمع و القراءة ضمن ما يعرف بالتعرف على الأنماط في علوم الحاسوب. ومن بين هذه الطرق الطريقة الشمولية (Holistic approach)، التي أثبتت كفاءتها في التعرف السريع (سمعاً أو قراءة) بالإضافة إلي مفهوم التعلم العميق الذي يعتبر ثورة في مجال تعلم الآلة في الوقت الحالي,وزاد الإهتمام به حديثاً خصوصاً بعد الزيادة الكبيرة في سرعة المعالجة الحاسوبية و التقدم في المعالجة المتوازية. هذه الدراسة تقدم تجارب إدراك ناجحة للشبكات العصبية العميقة في التعرف شمولياً على الأسماء العربية الأكثر شيوعاً، حيث تم إستخدام أدوات التعلم العميق و تمت تجربتها على السبعة أسماءالاكثر شيوعا بحسب مجموعة بيانات جامعة السودان للاسماء (SUST-ARG names) وبعد إجراء مراحل التدريب الخمسة , إستطاعت الشبكة أن تتعرف علي كل الأسماء وبنسبة 100% .
هدفنا من خلال هذه الدراسة في إطار المشروع الفصلي للسنة الرابعة إلى إلقاء الضوء على استرجاع الصور من مجموعة كبيرة بالاعتماد على محتوى صورة هدف , و قمنا بتدعيم هذه الدراسة بتطبيق ضمن بيئة الماتلاب لبرنامج بحث عن الصور المشابهة لصورة مدخلة . و قد تركز بحثنا على ميزتين هامتين يكاد لا يخلو منها أي نظام بحث عن الصور بالاعتماد على المحتوى و هما ميزتي الهيستوغرام اللوني و بنية الصورة texture , ووضحنا الخطوات التي يتم في ضوئها عملية الاسترجاع بدءاً من تحليل الصورة و استخلاص شعاع الواصفات الخاص فيها , و مطابقته مع أشعة الميزات الخاصة بالصور الموجودة في قاعدة البيانات ليتم ترتيب الصور بحسب مدى تشابهها من الصورة الهدف . و تطرقت الدراسة إلى استخدام الفضاء اللوني HMMD كبديل للفضاء اللوني RGB لاستخراج واصفات البنية اللونية على اعتبار أنه نموذج لوني موجه بالمستخدم user oriented و بالتالي نضمن أن نحصل على نتائج أفضل ترضي المستخدم . وقمنا بتدعيم الدراسة بعدد من الأشكال و الأمثلة و المخططات التي توضح محتوى الدراسة النظرية و ما قمنا بعمله في التطبيق ضمن بيئة الماتلاب .
تعد أنظمة استرجاع الصور الطبية اعتماداً على المحتوى من التقنيات الحديثة التي يسعى الباحثون إلى تكاملها مع أنظمة التشخيص بمساعدة الحاسوب. تقوم هذه الأنظمة أساساً بإيجاد صور في قاعدة بيانات تضم مجموعة كبيرة من الصور ذات محتوى مشابه لصورة استعلام معينة. يجري الاستعلام عن طريق استخلاص الخصائص البصرية للصورة المعينة و صياغتها في متجه خصائص تَُقارن مكوناته بمتجهات الخصائص للصور الموجودة في قاعدة البيانات و يقاس التشابه، و من ثم تسَترجع الصور التي لها محتوى مشابه لصورة الاستعلام. تقدم هذه الورقة تقييماً للوضع الراهن لأنظمة استرجاع الصور الطبية اعتماداً على المحتوى بناء على دراسة تحليلية للبحوث الحديثة المنشورة، و تخلص إلى استنتاج اتجاهات بحثية محددة في هذا المجال.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.
تتمثل إدارة المصطلح والمصطلان بخطوات حيوية لإعداد كل أخصائي لغة، ولعب دورا مهما للغاية في مرحلة تعليم محترفي الترجمة.يتزايد الاتجاه المتزايد من إدارة الوقت الفعالة والقيود الزمنية المستمرة التي قد نلاحظها في كل قطاع عمل بزيادة ضرورة تجميع المسرد التل قائي.تعتمد العديد من أنظمة AET ثنائية اللغة أداء جيدا على معالجة البيانات الموازية، ومع ذلك، فإن هذه الشركات الموازية ليست متاحة دائما لمجال معين أو زوج لغة.يعد الوصول إلى المجال الخاص، والوصول ثنائي اللغة إلى المعلومات واسترجاعه بناء على شركة Corpora المقارنة مجالا واعدةا كبيرا من البحث يتطلب تحليلا مفصلا لكلا من مصادر البيانات المتوفرة وتقنيات الاستخراج المحتملة.يركز هذا العمل على استخراج المصطلحات التلقائية الخاصة بالمجال من شركة Corga المقارنة للزوج باللغة الإنجليزية - اللغة الروسية من خلال الاستفادة من تضمين الكلمات العصبية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا