ترغب بنشر مسار تعليمي؟ اضغط هنا

تقديم استرجاع المعلومات لطلاب المعلوماتية الطبية الحيوية

Introducing Information Retrieval for Biomedical Informatics Students

365   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن إدخال طلاب المعلوماتيين الطبية الحيوية (BMI) للمعالجة اللغوية الطبيعية (NLP) يتطلب موازنة العمق الفني مع المعرفة العملية لمعالجة الاحتياجات التي تركز على التطبيق.قمنا بتطوير مجموعة من ثلاثة أنشطة إدخال طلاب BMI تمهيدي لاسترجاع المعلومات مع NLP، والغطاء استراتيجيات تمثيل المستندات ونماذج اللغة من TF-IDF إلى Bert.تزود هذه الأنشطة الطلاب بتجربة عملية مستهدفة نحو حالات الاستخدام المشترك، وإدخال مكونات أساسية من سير العمل NLP لمجموعة واسعة من التطبيقات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نعرض في هذا البحث مودل لتوسيع الاستعلامات التلقائية في نظم استرجاع المعلومات متعددة اللغات في المجال الطبي. يوظف المودل المستخدم ترجمة آلية للاستعلام في اللغة المصدر الى لغة المستندات وتابع انحدار خطي لتوقّع دقة الاسترجاع لكل استعلام مترجم عند توسيع هذا الاستعلام مع كلمة مرشحة. الكلمات المرشحة (في لغة المستندات) اختيرت من مصادر متعددة: الترجمات المقترحة للاستعلام التي تم الحصول عليها من نظام ترجمة آلي, مقالات ويكيبيديا, وملخصات PubMed. توسيع الاستعلام يُطبق فقط عندما يتوقّع المودل قيمة للكلمة المرشحة تتجاوز عتبة تم تدريبها مسبقا ليسمح ذلك لتوسيع الاستعلامات فقط بالكلمات المرتبطة بقوّة به. اختباراتنا تم تنفيذها على بيانات الاختبار الخاصة ب CLEF eHealth 2013-2015 وأظهرت تفوق ملحوظ في نظم استرجاع المعلومات متعددة اللغات واحادية اللغة.
القدرة على تحليل بيانات تسلسل الحمض النووي الريبي(RNA) بسهولة وكفاءة هي المفتاح الرئيس في أبحاث النواقل البيولوجية (Bioconductor). بدءًا من التعدادات الملخصة على مستوى الجين ، يشتمل التحليل النموذجي على المعالجة المسبقة والتحليل الاستكشافي للبيانات واختبار التعبير التفاضلي وتحليل المسار مع النتائج التي تم الحصول عليها والتي تخبرنا بالتجارب المستقبلية ودراسات التحقق.
على الرغم من النجاح الواسع النطاق للتعلم الإشراف على الذات من خلال نماذج لغة ملثم (MLM)، فإن التقاط علاقات الدلالية الدقيقة الدقيقة في المجال الطبي الحيوي يظل تحديا. هذا أمر بالغ الأهمية لمهام مستوى الكيان مثل الكيان الذي يربط حيث القدرة على نموذج ال علاقات الكيانية (خاصة المرادف) محورية. لمعالجة هذا التحدي، نقترح Sapbert، وهو مخطط الاحتجاط بأنه يتماشى على مساحة التمثيل من الكيانات الطبية الحيوية. نقوم بتصميم إطار تعلم متري قابل للتطوير الذي يمكنه الاستفادة من UMLs، وهي مجموعة هائلة من الأنتولوج الطبي الطبيعي مع مفاهيم 4M +. على النقيض من ذلك مع أنظمة Hybrid التي تعتمد على الأنابيب السابقة، تقدم Sapbert حلا أنيقا نموذجيا لمشكلة ربط الكيان الطبي (MEL)، وتحقيق حالة جديدة من بين الفن (SOTA) على ستة MEL Benchmark مجموعات البيانات. في المجال العلمي، نحقق سوتا حتى بدون إشراف خاص بمهام المهام. مع تحسن كبير على مختلف MLMS المحدد مسبقا للمجال مثل BioBert و SciberTand و PubMedbert، يثبت نظامنا المحدد فعال وقوي.
في هذه الورقة، نقدم نظام FJWU مقدم إلى المهمة المشتركة الطبية الحيوية في WMT21.أعدت أنظمة الترجمة الآلية العصبية متعددة اللغات لمدة ثلاث لغات (أي الألمانية والإسبانية والفرنسية) مع اللغة الإنجليزية كلغة مستهدفة.تم تدريب أنظمة NMT الخاصة بنا المستندة إلى بنية المحولات، على مجموعة من كورسيا الموازية داخل المجال والخروج المستخدمة باستخدام تقنيات استرجاع المعلومات (IR) وتقنيات تكيف المجال.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا