This paper presents a review of available algorithms and plagiarism detection systems، and an implementation of Plagiarism Detection System using available search engines on the web. Plagiarism detection in natural language documents is a complicat ed problem and it is related to the characteristics of the language itself. There are many available algorithms for plagiarism detection in natural languages .Generally these algorithms belong to two main categories ; the first one is plagiarism detection algorithms based on fingerprint and the second is plagiarism detection algorithms based on content comparison and includes string matching and tree matching algorithms . Usually available systems of plagiarism detection use specific type of detection algorithms or use a mixture of detection algorithms to achieve effective detection systems (fast and accurate). In this research, a plagiarism detection system has been developed using Bing search engine and a plagiarism detection algorithm based on Rhetorical Structure Theory.
This paper presents a reference study of available algorithms for plagiarism detection and it develops semantic plagiarism detection algorithm for plagiarism detection in medical research papers by employing the Medical Ontologies available on the World Wide Web. The issue of plagiarism detection in medical research written in natural languages is a complex issue and related exact domain of medical research. There are many used algorithms for plagiarism detection in natural language, which are generally divided into two main categories, the first one is comparison algorithms between files by using fingerprints of files, and files content comparison algorithms, which include strings matching algorithms and text and tree matching algorithms. Recently a lot of research in the field of semantic plagiarism detection algorithms and semantic plagiarism detection algorithms were developed basing of citation analysis models in scientific research. In this research a system for plagiarism detection was developed using “Bing” search engine, where tow type of ontologies used in this system, public ontology as wordNet and many standard international ontologies in medical domain as Diseases ontology which contains a descriptions about diseases and definitions of it and the derivation between diseases.
يعتبر تركيب الكلام بشكل آلي من أهم المسائل المطروحة في الذكاء الصنعي منذ بداياته، حيث تتزايد الحاجة لأنظمة تركيب كلام مستقرة بحيث تنتج خطاباً ذكياً مع كيفية الكلام الطبيعي. تركيب الكلام speech synthesis يعتبر الأهم في تصنيع آلات متحدثة قادرة على التو اصل مع الإنسان بطريقة فعالة وبسيطة، سواء في أنظمة الحوار الآلي Auto dialogue systems، توليد آلي للكتب الصوتية Auto generating of Audio books، متحدث مساعد لذوي الاحتياجات الخاصة different able humans، وغير ذلك من الأنظمة التي تحتاجها البشرية اعتماداً على معالجة اللغات الطبيعيةNatural language processing وفهم الكلام Language Understanding في سبيل خدمة التواصل بين الآلة والإنسان Human-computer Interaction.
Lexicon plays an essential role in natural language processing systems and specially the machine translation systems, because it provides the system's components with the necessary information for the translation process. Although there have been a number of researches in natural language processing field, not enough attention has been given to the importance of the lexicon and specially the Arabic lexicon.
This paper deals with automatic detection of plagiarism in Arabic documents. We present in this paper a new idea based on the experimentation of lexical chains. The proposed method extracts those chains from original document and uses a search engine to verify if such chains occur in other documents. The second step in our methods uses automatic translation system to translate lexical chains and verify by using search engine if those chain occurs in document in other languages. Then we compute a correlation ratio between lexical chains and lexical chains extracted from documents provided by the search engine to detect plagiarism in the original document. We present in the end of this paper our prototype called « Alkachef » developed to detect plagiarism in Arabic document .
Arabic sentiment analysis research existing currently is very limited. While sentiment analysis has many applications in English, the Arabic language is still recognizing its early steps in this field. In this paper, we show an application on Arabic sentiment analysis by implementing a sentiment classification for Arabic tweets. The retrieved tweets are analyzed to provide their sentiments polarity (positive, or negative). Since, this data is collected from the social network Twitter; it has its importance for the Middle East region, which mostly speaks Arabic
قمنا في هذا البحث باتباع نهج تحليل المشاعر المعتمد على المعجم لتحديد التوجه العام للطلاب، ايجابي او سلبي او محايد، اذ قمنا بداية ببناء معجم مشاعر انطلاقا من بعض المعاجم المعدة مسبقا ليتم اعتماده في عملية تحليل المشاعر، ثم قمنا بوضع نموذج يوجد رأي الط لاب العام بالاعتماد على المعجم السابق، يعالج النموذج الكتابي الكلمات التي تزيد من حدة المشاعر والرموز التعبيرية وبعض حالات النفي، وقمنا باضافة تفاعلات المستخدمين الأخرين مع المنشورات عند ايجاد التوجه العام بهدف اخذ أراء الطلاب الذين لم يعبروا عن أرائهم بنصوص مكتوبة.
With the increase in social networks, people have started to share information via different types of social media. Among themwere sites for exchanging people's opinions and others to exchange stories about real life and stories for children. In this work we made use of children's stories and employed them to teach children with Down syndrome the correct feelings by reading a story for them, converting it into text, processing the text using natural languages and extracting feelings automatically from This story, and to achieve this, we used several techniques, combined them, and compared their results on a number of short stories dedicated to children, where each of the different techniques that were unsupervised, such as Dictionary Based or supervised, such as data-dependent neural networks, were used to analyze feelings, where we used multiple classifiers. They are Support Vector Machine, Stochastic Gradient Descent, Decision Tree, Random Forest, Naïve Bayes, K-Nearest Neighbor, and Nearest Centroid We also used deep neural networks as the example of RNN. Finally, the correct sentiment for the story was reached through Dictionary Based which gave the best accuracy and then showed a photo that shows the child the expression they want to start with The events of this story to interact with him and learn the correct expression
مرت الشبكة العنكبوتية بأجيال متعددة منذ أن تم تطويرها عام ١٩٩٠م على يد تيم بيرنـرز لي Lee- Berners Tim ، فقد دعمت النشر الإلكتروني من خلال صفحات تسـتخدم لغـة ترميز النصوص الفائقة HTML ، ثم تطورت فيما بعد لتعتمد على النشر باستخدام نظم إدارة المحتوى. و قد كانت الشبكة العنكبوتية تحقق استرجاع المعلومات وتبادل المعرفة والمشـاركة فيها بين المستفيدين من أي مكان دون اعتبار للحواجز الجغرافية. ومع ظهور الجيل الثاني من الويب تم استخدام تقنيات وبروتوكولات حديثة للنشر الإلكتروني، وبدأت عملية استخدام الشبكة العنكبوتية تتجه نحو التفاعل بين المستفيد والنظام مـن خـلال التقنيات المختلفة مثل الويكي wiki ، و خدمة مـوجز الويـب (RSS (Syndication Really Simple ، والشبكات الاجتماعية، وغيرها... ومع الاتجاه نحو الجيل الثالث من الويب ظهر ما يعرف بتقنيات الويب الدلالي web Semantic ، الذي يعد ثورة في عالم المعلومات، حيـث أحدث نقلة في معالجة المعلومات عن طريق تحقيق فهم الويب لمعاني ودلالات الكلمات التـي يعالجها ويسترجعها؛ فلم يقتصر الأمر على ما كان عليه في السابق من التعامل مع الآلة مـن خلال التعرف على اللغة الثنائية (صفر وواحد)، دون فهم لدلالات المكتوب عبر الويب. وقد تبع هذا التطور، تطوراً في نظم استرجاع المعلومات المستخدمة مع هذا الجيل الجديد من الويب؛ حيث ظهر ما يعرف بالبحث الدلالي search Semantic ، ومحركات البحث التـي تقدم هذا النوع من البحث. وفي هذه الدراسة تعرف الباحثة بالبحث الدلالي وخصائصه، وما يميزه عن البحث التقليـدي، مع دراسة تطبيقية تحليلية لاستخدام أحد محركات البحث الدلالي مقارنة بأحد محركات البحث التقليدي، حيث تغطي الدراسة كل من محرك بحث حكيا، ومحرك بحث جوجل، للتعرف على بعض خصائصهما البحثية والاسترجاعية خلال فترة إجراء الدراسة التطبيقية في شهر نوفمبر من عام ٢٠١٠م.

