ترغب بنشر مسار تعليمي؟ اضغط هنا

استعراض خوارزميات كشف الانتحال التقليدية و الدلالية

Survey Of Traditional And Semantic Plagiarism Detection Algorithms

1760   0   17   0 ( 0 )
 تاريخ النشر 2016
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة العلمية نستعرض و نسرد ، المزايا و القيود المفروضة على التقنيات الفعالة المهمة التي تم توظيفها و تطويرها لكشف الانتحال في النصوص . و قد تبين أن العديد من الأساليب المقترحة لكشف الانتحال لديها نقاط ضعف و عدم الكشف عن بعض الأنواع من عمليات الانتحال. و تقوم هذه الورقة بدراسة مسحية حول كشف الانتحال بما في ذلك العديد من الموضوعات المهمة في كشف الانتحال، و هي تعريف الانتحال، و منع الانتحال و كشف الانتحال ، و أنظمة كشف الانتحال، و عمليات كشف الانتحال و بعض تقنيات كشف الانتحال الحالية. تقارن هذه الورقة بين مختلف خوارزميات كشف الانتحال، و تظهر نقاط الضعف، و نقاط القوة، و توصف قوة خوارزميات كشف الانتحال الدلالية، و تظهر فعالية هذه الخوارزميات في الكشف عن حالات الانتحال لا تستطيع خوارزميات كشف الانتحال الأخرى اكتشافها، حيث أنه تم تطوير خوارزميات كشف الانتحال الدلالية للتخلص من نقاط الضعف التقليدية التي تمتلها جميع خوارزميات كشف الانتحال الأخرى.


ملخص البحث
تستعرض هذه الورقة العلمية تقنيات كشف الانتحال النصي، مع التركيز على الخوارزميات التقليدية والدلالية. تتناول الورقة تعريف الانتحال، وطرق الوقاية منه، وأنظمة الكشف عنه، بالإضافة إلى العمليات والتقنيات المستخدمة حاليًا. تقارن الورقة بين الخوارزميات المختلفة، وتوضح نقاط الضعف والقوة لكل منها، مع التركيز على فعالية الخوارزميات الدلالية في الكشف عن حالات الانتحال التي قد لا تتمكن الخوارزميات التقليدية من اكتشافها. تتناول الورقة أيضًا أنظمة الكشف عن الانتحال عبر الإنترنت والأنظمة المستقلة، وتناقش كيفية تقليل الانتحال من خلال الوقاية والكشف اليدوي والمساعد بالحاسوب. كما تقدم الورقة مقارنة شاملة بين الخوارزميات التقليدية والدلالية، وتوضح أن الخوارزميات الدلالية هي الأكثر كفاءة لكنها معقدة أكثر من الخوارزميات التقليدية بسبب استخدامها لمصادر الويب الدلالية.
قراءة نقدية
دراسة نقدية: تقدم هذه الورقة نظرة شاملة ومفصلة حول تقنيات كشف الانتحال، وتسلط الضوء على نقاط القوة والضعف في كل خوارزمية. ومع ذلك، يمكن القول أن الورقة تفتقر إلى تقديم أمثلة عملية أو دراسات حالة توضح كيفية تطبيق هذه الخوارزميات في بيئات حقيقية. كما أن التركيز الكبير على الخوارزميات الدلالية قد يجعل القارئ يشعر بأن الخوارزميات التقليدية ليست فعالة بما فيه الكفاية، على الرغم من أنها قد تكون كافية في بعض الحالات. بالإضافة إلى ذلك، يمكن أن تكون الورقة أكثر فائدة إذا تضمنت توصيات محددة حول كيفية تحسين الخوارزميات الحالية أو دمجها لتحقيق أفضل النتائج.
أسئلة حول البحث
  1. ما هي الأنواع المختلفة للانتحال التي تم ذكرها في الورقة؟

    تشمل الأنواع المختلفة للانتحال التي تم ذكرها في الورقة: النسخ واللصق، انتحال الفقرات، انتحال الأفكار، والانتحال عبر اللغات من خلال الترجمة.

  2. ما هي الأنظمة المستخدمة في الكشف عن الانتحال عبر الإنترنت؟

    تشمل الأنظمة المستخدمة في الكشف عن الانتحال عبر الإنترنت: Turnitin وSafeAssign، حيث يستخدم كل منهما قواعد بيانات ضخمة من الإنترنت وأعمال الطلاب السابقة للمقارنة مع الوثيقة المشكوك فيها.

  3. ما هي نقاط الضعف الرئيسية في خوارزميات كشف الانتحال التقليدية؟

    تشمل نقاط الضعف الرئيسية في خوارزميات كشف الانتحال التقليدية: التأثر الشديد بإعادة ترتيب الكلمات واستبدال المرادفات، وصعوبة تحديد الطول الأمثل للسلاسل النصية للمطابقة، والغموض في اللغة الطبيعية الذي يؤدي إلى تمثيل النص بأكثر من شجرة واحدة.

  4. ما هي المزايا الرئيسية للخوارزميات الدلالية في كشف الانتحال؟

    المزايا الرئيسية للخوارزميات الدلالية في كشف الانتحال تشمل قدرتها على اكتشاف حالات الانتحال التي لا تستطيع الخوارزميات التقليدية اكتشافها، وذلك من خلال استخدام القواميس الدلالية واللغات الدلالية للويب لتحليل النصوص والكشف عن التشابهات الدلالية.


المراجع المستخدمة
J. J. G. Adeva, et al., "Applying plagiarism detection to engineering education," 2006, pp. 722-731
C. Lyon, et al., "Plagiarism is easy, but also easy to detect," Plagiary: CrossDisciplinary Studies in Plagiarism, Fabrication, and Falsification, vol. 1, 2006
L. Chao, L., et al., “GPLAG: detection of software plagiarism by program dependence graph analysis,” the 12th ACM SIGKDD international conference on Knowledge discovery and data mining. 2006, ACM: Philadelphia, PA, USA
قيم البحث

اقرأ أيضاً

يقدم هذا البحث دراسة مرجعية عن الخوارزميات و الأنظمة المتوفرة لكشف الانتحال ، و يقوم بتصميم و بناء تطبيق لكشف الانتحال في الأبحاث الطبية بتوظيف الأنطولوجيات الطبية العالمية المتوفرة على الشبكة العنكبوتية . إن مسألة كشف الانتحال في الأبحاث الطبية الم كتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بالمجال الدقيق للابحاث الطبية . يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية و التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات ، و خوارزميات مقارنة محتوى الملفات و التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات . حديثا تم البحث في مجال خوارزميات كشف الانتحال ذات البعد الدلالي فتم تطوير خوارزميات كشف الانتحال الدلالية المعتمدة على تحليل نماذج الاقتباس في الأبحاث العلمية . تمَ في هذا العمل تطوير نظام لكشف الانتحال باستخدام محرك البحث Bing ، حيث تم استخدام خوارزمية تعتمد على استخدام و توظيف نوعين من الانطولوجيات و هي الأنطولوجيات العامة مثل وورد نت ( WordNet ) و الأنطلوجيات الطبية العالمية أشهرها أنطولوجيا الأمراض Diseases ontology التي تحتوي على توصيف الأمراض و خصائصها و تعريفها و اشتقاق الأمراض من بعضها.
قدم هذا البحث دراسة مرجعية عن الخوارزميات و النظم المتوافرة لكشف الانتحال، إِذ صمم و بني تطبيق لكشف الانتحال باستخدام محركات البحث المتوافرة على الشبكة العنكبوتية. إن مسألة كشف الانتحال في الوثائق المكتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بخصا ئص اللغة الطبيعية المعنية نفسها. يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات، و خوارزميات مقارنة محتوى الملفات التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات. تعتمد نظم كشف الانتحال على نوع محدد أو مزيج من خوارزميات كشف الانتحال؛ و ذلك للحصول على نظم كشف انتحال فعالة (سريعة و دقيقة). طور في هذا العمل نظام لكشف الانتحال باستخدام محرك البحث Bing و قد استخدمت خوارزمية تعتمد على خصائص اللغة،باستخدام نظرية بنية الكلام البلاغية (Rhetorical Structure Theory ).
ساهم تقدم تقنية الويب والمعلومات في النمو السريع للمكتبات الرقمية وأدوات ترجمة الآلات التلقائية والتي تقوم بسهولة بترجمة النصوص من لغة إلى أخرى. وقد زادت هذه المحتوى في الوصول إلى لغات مختلفة، مما يؤدي إلى أداء الانتحال المترجم بسهولة، يشار إليها باس م الانتحال عبر اللغة ". التعرف على الانتحال بين النصوص بلغات مختلفة هو أكثر تحديا من تحديد الانتحال داخل وجعة مكتوبة بنفس اللغة. تقترح هذه الورقة تقنية جديدة لتعزيز اكتشاف الانتحال باللغة الإنجليزية والعربية على مستوى الجملة. تستند هذه التقنية إلى استخراج ميزة دلالية ونقصية باستخدام ترتيب Word و Word AdgetDing و MIGNIMENT مع ترميزات متعددة اللغات. يتم بعد ذلك استخدام هذه الميزات ومجمديها مع خوارزميات مختلفة لتعلم الآلات (ML) من أجل المساعدة في تصنيف الجمل كإخلاء إما مكسوين أو غير متسائل. تم نشر النهج المقترح وتقييمه باستخدام مجموعات البيانات المقدمة في Semeval-2017. يوضح تحليل البيانات التجريبية المستخدمة في استخدام الميزات المستخرجة ومجموعاتها مع مختلف منصات ML، تحقق نتائج واعدة.
أجريت هذه الدراسة على تجمعات طيور الحمام الأهلي في محافظات حماه و ادلب و اللاذقية باستخدام عدة تقنيات تشخيصية تقليدية منها التشريحي المرضي و اختبار المطاخة و الانتشار المناعي بالآغار الهلامي و العزم على جنيف الدجاج. كان عدد الطيور المشتبه بإصابتها بفيروس جدري الحمام من خلال الأعراض السريرية و الآفات العيانية 37 طائرا. حيث لوحظ وجود آفات على شكل ثآليل و ندب على مناطق الوجه الخالية من الريش و على زاوية الفم و الأجفان و مناطق أخرى من الجسم حيث ترافقت غالبية الإصابات بوجود إصابات آفات دفتيرية على الغشاء المخاطي للتجويف الفموي. أظهرت النتائج أن جميع الطيور عانت من وجود إصابة بجدري الطيور من خلال الفحص النسيجي المرضي للآفات الجلدية و الدفتيرية. و تم تأكيد النتائج من خلال اختبار الانتشار على الآغار الهلامي، كما أمكن بنجاح عزل الفيروس المسبب للمرض بالحقن على الغشاء المشيمي اللقانقي لبيض دجاج مخصب SAN.
يندرج هذا البحث في إطار الكشف الآلي لعمليات الإنتحال في النصوص المدوّنة باللغة العربية وتقدّم هذه الورقة طريقة مبتكرة تعتمد على استخراج الكلمات الهامة في النص المراد كشفه ومن ثمّ تكوين سلاسل لغوية حسب تواترها في النص. وباستعمال محركات البحث يمكن التث بت من وجود هذه السلاسل اللغوية في نصوص أخرى. في مرحلة ثانية قمنا باستعمال الترجمة الآلية للسلاسل اللغوية قصد استخراج السلاسل المرادفة باللغة الإنجليزية ومن ثمّ استعمال محركات البحث لاستخراج النصوص المدوّنة باللغة الإنجليزية والتي تتطابق مع السلاسل بعد ترجمتها. وتقدّم هذه الورقة العلمية برنامج الكاشف وهو برنامج لكشف حالات الإنتحال وقد قمنا بتقييم البرنامج على مدونة من النصوص العربية وأبرزت النتائج كفاءة الطريقة المتبعة

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا