ترغب بنشر مسار تعليمي؟ اضغط هنا

كشف الانتحال في الابحاث الطبية باستخدام الأنطولوجيات الطبية

Plagiarism Detection in Medical Research Using Medical Ontology

1862   3   65   0 ( 0 )
 تاريخ النشر 2016
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يقدم هذا البحث دراسة مرجعية عن الخوارزميات و الأنظمة المتوفرة لكشف الانتحال ، و يقوم بتصميم و بناء تطبيق لكشف الانتحال في الأبحاث الطبية بتوظيف الأنطولوجيات الطبية العالمية المتوفرة على الشبكة العنكبوتية . إن مسألة كشف الانتحال في الأبحاث الطبية المكتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بالمجال الدقيق للابحاث الطبية . يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية و التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات ، و خوارزميات مقارنة محتوى الملفات و التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات . حديثا تم البحث في مجال خوارزميات كشف الانتحال ذات البعد الدلالي فتم تطوير خوارزميات كشف الانتحال الدلالية المعتمدة على تحليل نماذج الاقتباس في الأبحاث العلمية . تمَ في هذا العمل تطوير نظام لكشف الانتحال باستخدام محرك البحث Bing ، حيث تم استخدام خوارزمية تعتمد على استخدام و توظيف نوعين من الانطولوجيات و هي الأنطولوجيات العامة مثل وورد نت ( WordNet ) و الأنطلوجيات الطبية العالمية أشهرها أنطولوجيا الأمراض Diseases ontology التي تحتوي على توصيف الأمراض و خصائصها و تعريفها و اشتقاق الأمراض من بعضها.


ملخص البحث
يقدم هذا البحث دراسة مرجعية عن الخوارزميات والأنظمة المتوفرة لكشف الانتحال، ويقوم بتصميم وبناء تطبيق لكشف الانتحال في الأبحاث الطبية بتوظيف الأنطولوجيات الطبية العالمية المتوفرة على الشبكة العنكبوتية. يتناول البحث مشكلة كشف الانتحال في الأبحاث الطبية المكتوبة باللغات الطبيعية ويعرض تعقيداتها. يتم تقسيم الخوارزميات المستخدمة إلى صنفين رئيسيين: خوارزميات بصمة الملفات وخوارزميات مقارنة محتوى الملفات. كما يناقش البحث خوارزميات كشف الانتحال ذات البعد الدلالي التي تعتمد على تحليل نماذج الاقتباس. تم تطوير نظام لكشف الانتحال باستخدام محرك البحث Bing، حيث تم استخدام خوارزمية تعتمد على نوعين من الأنطولوجيات: الأنطولوجيات العامة مثل وورد نت، والأنطولوجيات الطبية مثل أنطولوجيا الأمراض. يهدف البحث إلى التغلب على نقاط الضعف في الخوارزميات التقليدية من خلال استخدام الأنطولوجيات الدلالية. تم اختبار الخوارزمية على 200 ورقة علمية وأظهرت نتائج فعالة في كشف الانتحال.
قراءة نقدية
دراسة نقدية: على الرغم من أن البحث يقدم حلاً مبتكراً لكشف الانتحال في الأبحاث الطبية باستخدام الأنطولوجيات، إلا أنه يواجه بعض التحديات. أولاً، يعتمد النظام بشكل كبير على الأنطولوجيات المتاحة على الشبكة العنكبوتية، والتي قد تكون غير متكاملة أو غير محدثة بشكل دوري. ثانياً، يقتصر النظام على الأبحاث المكتوبة باللغة الإنجليزية فقط، مما يقلل من فعاليته في البيئات متعددة اللغات. ثالثاً، لا يتناول البحث بشكل كافٍ كيفية التعامل مع الأشكال والجداول في النصوص، والتي قد تحتوي على معلومات دلالية هامة. وأخيراً، قد يكون استخدام محرك البحث Bing غير كافٍ للحصول على جميع الأوراق العلمية ذات الصلة، مما قد يؤثر على دقة النظام.
أسئلة حول البحث
  1. ما هي الأنطولوجيات المستخدمة في هذا البحث لكشف الانتحال؟

    تم استخدام الأنطولوجيات العامة مثل وورد نت، والأنطولوجيات الطبية مثل أنطولوجيا الأمراض، أنطولوجيا التشريح، أنطولوجيا الجينات، أنطولوجيا رؤوس الموضوعات الطبية، وأنطولوجيا العلوم الطبية العامة.

  2. ما هي الخوارزميات التقليدية لكشف الانتحال التي تم مناقشتها في البحث؟

    تم مناقشة خوارزميات بصمة الملفات وخوارزميات مقارنة محتوى الملفات، والتي تشمل خوارزميات مقارنة السلاسل النصية وخوارزميات مقارنة البنى الشجرية.

  3. ما هي نقاط الضعف في الخوارزميات التقليدية لكشف الانتحال؟

    تعاني الخوارزميات التقليدية من مشاكل مثل عدم القدرة على كشف الانتحال عند إعادة ترتيب الكلمات أو استبدالها بمرادفات، وتأثرها بالغموض الموجود في اللغات الطبيعية، وصعوبة تحديد طول السلسلة المناسب للمقارنة.

  4. كيف تم اختبار فعالية الخوارزمية المطورة في هذا البحث؟

    تم اختبار الخوارزمية على 200 ورقة علمية ضمن اختصاص الطب، وتم انتحال العديد من الأوراق بشكل يدوي بطرق مختلفة. تم حساب فعالية الخوارزمية باستخدام معامل الحساسية، وأظهرت النتائج نسبة حساسية عالية في كشف حالات الانتحال.


المراجع المستخدمة
Vinod K.R.،Sandhya.S،Sathish Kumar D،Harani A،David Banji and،Otilia JF Banji 2011 ، Plagiarism history ،detection and prevention, Hygeia, Vol.3-Issue.1-Page 1- 4
Maxim mozgovoy, enhancing computer-aided plagiarism , university of joensuu computer science and statistics dissertations 18
Schleimer, S., Wilkerson, D. S., & Aiken, A. (2003). Winnowing: Local Algorithms for Document Fingerprinting. Proceedings of the 2003 ACM SIGMOD International Conference on on Management of Data - SIGMOD ’03, 76–85
قيم البحث

اقرأ أيضاً

قدم هذا البحث دراسة مرجعية عن الخوارزميات و النظم المتوافرة لكشف الانتحال، إِذ صمم و بني تطبيق لكشف الانتحال باستخدام محركات البحث المتوافرة على الشبكة العنكبوتية. إن مسألة كشف الانتحال في الوثائق المكتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بخصا ئص اللغة الطبيعية المعنية نفسها. يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات، و خوارزميات مقارنة محتوى الملفات التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات. تعتمد نظم كشف الانتحال على نوع محدد أو مزيج من خوارزميات كشف الانتحال؛ و ذلك للحصول على نظم كشف انتحال فعالة (سريعة و دقيقة). طور في هذا العمل نظام لكشف الانتحال باستخدام محرك البحث Bing و قد استخدمت خوارزمية تعتمد على خصائص اللغة،باستخدام نظرية بنية الكلام البلاغية (Rhetorical Structure Theory ).
من أجل توفير الرعاية عالية الجودة، يجب على المهنيين الصحيين تحديد الوجود أو احتمال أو عدم وجود الأعراض والعلاجات وغيرها من الكيانات ذات الصلة في الملاحظات السريرية النصية.هذه هي مهمة اكتشاف التأكيد - لتحديد فئة التأكيد (الحاضر، ممكن، غائبة) من كيان ب ناء على إشارات نصية في النص غير المنظم.نقيم نماذج اللغة الطبية الحديثة في المهمة وإظهار أنها تتفوق على الأساس في جميع الفئات الثلاثة.نظرا لأن قابلية النقل مهمة بشكل خاص في المجال الطبي، فإننا ندرس كيفية تصرف أفضل نموذج أداء على البيانات غير المرئية من مجموعات بيانات طبية أخرى.لهذا الغرض، نقدم مجموعة مشروحة حديثا من 5000 تأكيد لمجموعة بيانات MIMIC-III المتاحة للجمهور.نستنتج مع تحليل خطأ يكشف المواقف التي لا تزال النماذج خاطئة ونقاط نحو اتجاهات البحث في المستقبل.
في هذه الورقة العلمية نستعرض و نسرد ، المزايا و القيود المفروضة على التقنيات الفعالة المهمة التي تم توظيفها و تطويرها لكشف الانتحال في النصوص . و قد تبين أن العديد من الأساليب المقترحة لكشف الانتحال لديها نقاط ضعف و عدم الكشف عن بعض الأنواع من عمليات الانتحال. و تقوم هذه الورقة بدراسة مسحية حول كشف الانتحال بما في ذلك العديد من الموضوعات المهمة في كشف الانتحال، و هي تعريف الانتحال، و منع الانتحال و كشف الانتحال ، و أنظمة كشف الانتحال، و عمليات كشف الانتحال و بعض تقنيات كشف الانتحال الحالية. تقارن هذه الورقة بين مختلف خوارزميات كشف الانتحال، و تظهر نقاط الضعف، و نقاط القوة، و توصف قوة خوارزميات كشف الانتحال الدلالية، و تظهر فعالية هذه الخوارزميات في الكشف عن حالات الانتحال لا تستطيع خوارزميات كشف الانتحال الأخرى اكتشافها، حيث أنه تم تطوير خوارزميات كشف الانتحال الدلالية للتخلص من نقاط الضعف التقليدية التي تمتلها جميع خوارزميات كشف الانتحال الأخرى.
نحن نعتبر مشكلة التعلم بتبسيط النصوص الطبية. هذا مهم لأن معظم المعلومات الأكثر موثوقية وحديثة في الطب الحيوي كثيفة مع Jargon وبالتالي لا يمكن الوصول إليها عمليا للجمهور العادي. علاوة على ذلك، لا يتجاوز التبسيط اليدوي للجسم بسرعة متزايدة من الأدب الطب ي الطبيعي، يحفز الحاجة إلى النهج الآلي. لسوء الحظ، لا توجد موارد واسعة النطاق المتاحة لهذه المهمة. في هذا العمل، نقدم جثة جديدة من النصوص الموازية باللغة الإنجليزية تضم ملخصات تقنية ووضع جميع الأدلة المنشورة المتعلقة بالموضوعات السريرية المختلفة. بعد ذلك، نقترح مقياسا جديدا يستند إلى درجات احتمالية من نموذج لغة ملثم مسبقا على النصوص العلمية. نظهر أن هذا التدبير الآلي يتحمل أفضل بين الملخصات التقنية والوضعية من الاستدلال القائمة. نقدم وتقييم نماذج محول ترميز تشفير الأساس لتبسيطها واقتراح تكبير رواية لهذه التي تعاقب فيها بشكل صريح فك الترميز لإنتاج مصطلحات JARGON؛ نجد أن هذا يجرض التحسينات على أساس الأساس من حيث قابلية القراءة.
يمكن استخراج المعلومات المهيكلة من المحادثات الطبية تقليل عبء الوثائق للأطباء ومساعدة المرضى الذين يتبعون مع خطة الرعاية الخاصة بهم.في هذه الورقة، نقدم مهمة جديدة لاستخراج المواعيد يمتد من المحادثات الطبية.نحن نؤيد هذه المهمة كمشكلة علامات تسلسل والت ركيز على استخراج يمتد لسبب الموعد والوقت.ومع ذلك، فإن التسجيل المحادثات الطبية باهظة الثمن، وتستغرق وقتا طويلا، ويتطلب من خبرات مجال كبيرة.وبالتالي، نقترح أن نستفيد مناهج الإشراف الضعيفة، وهي الإشراف غير المكتملة والإشراف غير الدقيق، ونهج إشراف هجين وتقييم كل من ELMO - ELMO وبرت خاصة بالمجال باستخدام نماذج علامات التسلسل.أفضل نموذج أداء هو متغير Bertiant الخاص بالمجال باستخدام الإشراف الهجين الضعيف والحصول على درجة F1 79.32.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا