اخترنا في هذا المشروع العمل على تطوير نظام يقوم بتصنيف المستندات العربية حسب محتواها, يقوم هذه النظام بالتحليل اللفظي لكلمات المستند ثم إجراء عملية Stemming"رد الأفعال إلى أصلها" ثم تطبيق عملية إحصائية على المستند في مرحلة تدريب النظام ثم بالاعتماد على خوارزميات في الذكاء الصنعي يتم تصنيف المستند حسب محتواه ضمن عناقيد
تحتل الدراسات التي تتناول حوسبة اللغة العربية أهمية كبيرة نظراً للانتشار الواسع للغة العربية , و اخترنا في هذه الدراسة العمل على معالجة اللغة العربية من خلال نظام استرجاع معلومات للمستندات باللغة العربية , الفكرة الأساسية لهذا النظام هو تحليل المستن دات والنصوص العربية و إنشاء فهارس للمصطلحات الواردة فيها , ومن ثم استخلاص أشعة أوزان تعبر عن هذه المستندات من أجل المعالجة اللاحقة للاستعلام و المقارنة مع هذه الأشعة للحصول على المستندات الموافقة لهذا الاستعلام . من خلال عملية تجريد للمصطلحات الواردة في المستندات تم الحصول على كفاءة استرجاع أفضل , و تعرضنا للعديد من خوارزميات التجريد التي وصلت إليها الدراسات السابقة . و تأتي عملية عنقدة المستندات كإضافة هامة , حيث يتمكن المستخدم من معرفة المستندات المشابهة لنتيجة البحث و التي لها صلة بـالاستعلام المدخل . في التطبيق العملي , تم العمل على نظام استرجاع معلومات مكتبي , يقوم بقراءة نصوص ذات أنواع مختلفة و عرض النتائج مع العناقيد الموافقة لها .
Lexicon plays an essential role in natural language processing systems and specially the machine translation systems, because it provides the system's components with the necessary information for the translation process. Although there have been a number of researches in natural language processing field, not enough attention has been given to the importance of the lexicon and specially the Arabic lexicon.
Arabic sentiment analysis research existing currently is very limited. While sentiment analysis has many applications in English, the Arabic language is still recognizing its early steps in this field. In this paper, we show an application on Arabic sentiment analysis by implementing a sentiment classification for Arabic tweets. The retrieved tweets are analyzed to provide their sentiments polarity (positive, or negative). Since, this data is collected from the social network Twitter; it has its importance for the Middle East region, which mostly speaks Arabic
قمنا في هذا البحث باتباع نهج تحليل المشاعر المعتمد على المعجم لتحديد التوجه العام للطلاب، ايجابي او سلبي او محايد، اذ قمنا بداية ببناء معجم مشاعر انطلاقا من بعض المعاجم المعدة مسبقا ليتم اعتماده في عملية تحليل المشاعر، ثم قمنا بوضع نموذج يوجد رأي الط لاب العام بالاعتماد على المعجم السابق، يعالج النموذج الكتابي الكلمات التي تزيد من حدة المشاعر والرموز التعبيرية وبعض حالات النفي، وقمنا باضافة تفاعلات المستخدمين الأخرين مع المنشورات عند ايجاد التوجه العام بهدف اخذ أراء الطلاب الذين لم يعبروا عن أرائهم بنصوص مكتوبة.
Designing Computerized Systems which posses reading and hearing faculties is an active research area for more than four decades. Many methods and algorithms have been suggested by researches for this purpose as part of pattern recognition research . Recently, more research work has been devoted to the holist approach the recognition system recognizes a complete word as one object without going through the long and erroneous character segmentation process. In this paper, a convolutional neural network has been designed to recognize the popular Arabic names holistically. SUSt ARG names data set has been used to test the network performance (collected and compiled by pattern recognition research in Sudan University of Science and Technology-SUSt). Selecting an appropriate deep learning toolbox, after five stages of training, the network was able to recognize all the names and 100%
With the increase in social networks, people have started to share information via different types of social media. Among themwere sites for exchanging people's opinions and others to exchange stories about real life and stories for children. In this work we made use of children's stories and employed them to teach children with Down syndrome the correct feelings by reading a story for them, converting it into text, processing the text using natural languages and extracting feelings automatically from This story, and to achieve this, we used several techniques, combined them, and compared their results on a number of short stories dedicated to children, where each of the different techniques that were unsupervised, such as Dictionary Based or supervised, such as data-dependent neural networks, were used to analyze feelings, where we used multiple classifiers. They are Support Vector Machine, Stochastic Gradient Descent, Decision Tree, Random Forest, Naïve Bayes, K-Nearest Neighbor, and Nearest Centroid We also used deep neural networks as the example of RNN. Finally, the correct sentiment for the story was reached through Dictionary Based which gave the best accuracy and then showed a photo that shows the child the expression they want to start with The events of this story to interact with him and learn the correct expression
يهدف البحث إلى دراسة خصائص اللغة العربية المؤثرة في عملية استرجاع المعلومات والتعرف على المشاكل الناجمة عن استخدام اللغة العربية في نظم استرجاع المعلومات بمختلف انواعها وايجاد حلول ومقترحات لها. والمقارنة بين ادوات واستراتيجيات البحث المستخدمة في نظم استرجاع المعلومات من حيث تاثيرها على معدلات التحقق للوثائق المسترجعة ودراسة أثر استخدام او عدم استخدام تقنيات معالجة اللغة العربية في الحواسيب (المدقق النحوي، المحلل الصرفي وغيرها) على معالجة خصائص اللغة العربية (الترادف، المشترك اللفظي ...).

