قدم هذا البحث دراسة مرجعية عن الخوارزميات و النظم المتوافرة لكشف الانتحال، إِذ صمم و بني تطبيق لكشف الانتحال باستخدام محركات البحث المتوافرة على الشبكة العنكبوتية. إن مسألة كشف الانتحال في الوثائق المكتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بخصائص اللغة الطبيعية المعنية نفسها.
يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية التي تقسم بشكل عام إلى صنفين رئيسين هما
خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات، و خوارزميات مقارنة محتوى الملفات التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات.
تعتمد نظم كشف الانتحال على نوع محدد أو مزيج من خوارزميات كشف الانتحال؛ و ذلك للحصول على نظم كشف انتحال فعالة (سريعة و دقيقة).
طور في هذا العمل نظام لكشف الانتحال باستخدام محرك البحث Bing و قد استخدمت خوارزمية تعتمد على خصائص اللغة،باستخدام نظرية بنية الكلام البلاغية (Rhetorical Structure Theory ).
This paper presents a review of available algorithms and plagiarism detection systems، and an
implementation of Plagiarism Detection System using available search engines on the web.
Plagiarism detection in natural language documents is a complicated problem and it is related to the
characteristics of the language itself.
There are many available algorithms for plagiarism detection in natural languages .Generally these
algorithms belong to two main categories ; the first one is plagiarism detection algorithms based on
fingerprint and the second is plagiarism detection algorithms based on content comparison and includes
string matching and tree matching algorithms .
Usually available systems of plagiarism detection use specific type of detection algorithms or use a
mixture of detection algorithms to achieve effective detection systems (fast and accurate).
In this research, a plagiarism detection system has been developed using Bing search engine and a
plagiarism detection algorithm based on Rhetorical Structure Theory.
References used
Shizhong Wu; Yongle Hao; Xinyu Gao; Baojiang Cui; Ce Bian, Homology Detection Based on Abstract Syntax Tree Combined Simple Semantics Analysis, Web Intelligence and Intelligent Agent Technology (WI-IAT), vol.3, pp.410-414, 2010
Vinod K.R., Sandhya.S, Sathish Kumar D, Harani A, David Banji, Otilia JF Banji, Plagiarism-history detection and prevention, Journal for drugs and medicines, Vol.3, Issue:1, pp.1- 4, 2011
Al-Khatib B., Aspel A. ,Saleh M., fares M.، Hamad M.M., plagiarism detection using the web, Damascus university,informatics engineering college, 2007
Al-Sanie W., Towards an infrastructure for Arabic text Summarization using Rhetorical Structure Theory, master thesis , king Saud University, K.S.A., 2005
[Bing , API Basics. [online] Available at: http://www.bing.com/developers/s/APIBasics.ht ml [Accessed 15-October 2011