ترغب بنشر مسار تعليمي؟ اضغط هنا

المحاذاة الذاتية محاكاة لتمثيل الكيانات الطبية الحيوية

Self-Alignment Pretraining for Biomedical Entity Representations

585   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

على الرغم من النجاح الواسع النطاق للتعلم الإشراف على الذات من خلال نماذج لغة ملثم (MLM)، فإن التقاط علاقات الدلالية الدقيقة الدقيقة في المجال الطبي الحيوي يظل تحديا. هذا أمر بالغ الأهمية لمهام مستوى الكيان مثل الكيان الذي يربط حيث القدرة على نموذج العلاقات الكيانية (خاصة المرادف) محورية. لمعالجة هذا التحدي، نقترح Sapbert، وهو مخطط الاحتجاط بأنه يتماشى على مساحة التمثيل من الكيانات الطبية الحيوية. نقوم بتصميم إطار تعلم متري قابل للتطوير الذي يمكنه الاستفادة من UMLs، وهي مجموعة هائلة من الأنتولوج الطبي الطبيعي مع مفاهيم 4M +. على النقيض من ذلك مع أنظمة Hybrid التي تعتمد على الأنابيب السابقة، تقدم Sapbert حلا أنيقا نموذجيا لمشكلة ربط الكيان الطبي (MEL)، وتحقيق حالة جديدة من بين الفن (SOTA) على ستة MEL Benchmark مجموعات البيانات. في المجال العلمي، نحقق سوتا حتى بدون إشراف خاص بمهام المهام. مع تحسن كبير على مختلف MLMS المحدد مسبقا للمجال مثل BioBert و SciberTand و PubMedbert، يثبت نظامنا المحدد فعال وقوي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن إدخال طلاب المعلوماتيين الطبية الحيوية (BMI) للمعالجة اللغوية الطبيعية (NLP) يتطلب موازنة العمق الفني مع المعرفة العملية لمعالجة الاحتياجات التي تركز على التطبيق.قمنا بتطوير مجموعة من ثلاثة أنشطة إدخال طلاب BMI تمهيدي لاسترجاع المعلومات مع NLP، وا لغطاء استراتيجيات تمثيل المستندات ونماذج اللغة من TF-IDF إلى Bert.تزود هذه الأنشطة الطلاب بتجربة عملية مستهدفة نحو حالات الاستخدام المشترك، وإدخال مكونات أساسية من سير العمل NLP لمجموعة واسعة من التطبيقات.
في هذه الورقة، نقدم نظام FJWU مقدم إلى المهمة المشتركة الطبية الحيوية في WMT21.أعدت أنظمة الترجمة الآلية العصبية متعددة اللغات لمدة ثلاث لغات (أي الألمانية والإسبانية والفرنسية) مع اللغة الإنجليزية كلغة مستهدفة.تم تدريب أنظمة NMT الخاصة بنا المستندة إلى بنية المحولات، على مجموعة من كورسيا الموازية داخل المجال والخروج المستخدمة باستخدام تقنيات استرجاع المعلومات (IR) وتقنيات تكيف المجال.
تهدف محاذاة الكيان المتبادل (EA) إلى إيجاد الكيانات المكافئة بين Crosslingual KGS (الرسوم البيانية المعرفة)، وهي خطوة حاسمة لإدماج KGS.في الآونة الأخيرة، يتم اقتراح العديد من طرق EA القائمة على GNN وإظهار تحسينات الأداء اللائق على العديد من مجموعات ا لبيانات العامة.ومع ذلك، فإن طرق EA القائمة القائمة على GNN ترثت حتما بشكل حتمة الترجمة الشفوية والكفاءة المنخفضة من الشبكات العصبية.تحفزه افتراض ISOMORPHIC من الأساليب القائمة على GNN، ونحن نجح في تحويل مشكلة EA عبر اللغات في مشكلة مهمة.بناء على هذا التعريف، نقترح طريقة محاذاة كيان بسيطة ولكنها فعالة بشكل محبط (SEU) دون شبكات عصبية.أجريت تجارب واسعة لإظهار أن نهجنا المقترح غير المقترح حتى يدق طرق متقدمة تحت إشراف على جميع مجموعات البيانات العامة مع ارتفاع الكفاءة والتفسيرية والاستقرار.
يعد استرجاع الكيانات، الذي يهدف إلى إشراف الإزهام إلى الكيانات الكنسية من KBS ضخمة، ضروريا للعديد من المهام في معالجة اللغة الطبيعية.يوضح التقدم المحرز الأخير في استرجاع الكيانات أن هيكل التشفير المزدوج هو إطار قوي وفعال لترشيح المرشحين إذا تم تحديد الكيانات إلا بواسطة الأوصاف.ومع ذلك، فإنهم يتجاهلون العقار الذي يذكرنى أن معاني الكيان تذكر في سياقات مختلفة وترتبط بأجزاء مختلفة من الأوصاف، والتي تعامل على قدم المساواة في الأعمال السابقة.في هذا العمل، نقترح تمثيل كيان متعدد النقود (MURES)، وهو نهج رواية لاسترجاع الكيان الذي يبني تمثيلات متعددة المشاهدات لأوصاف الكيان وتقريب الرأي الأمثل للإشراف عبر طريقة البحث المثيرة.تحقق طريقةنا الأداء الحديثة على Zeshel ويحسن جودة المرشحين في مجموعات بيانات ربط كيان قياسية.
تصف هذه الورقة أنظمة Fujitsu Dmath المستخدمة لترجمة WMT 2021، ومهام الترجمة الطبية الحيوية.ركزنا على أزواج منخفضة الموارد، باستخدام نظام بسيط.أجرينا تجارب على اللغة الإنجليزية هوسا، Xhosa-Zulu والإنجليزية-الباسك، وقدمت نتائج Xhosa → Zulu في مهمة ترجم ة الأخبار، والإنجليزية → الباسك في مهمة الترجمة الطبية الحيوية، ومصادر الترجمة التابعة للمصطلح والمصطلحات.يجمع نظامنا بين تسرب BPE، ميزات الكلمات الفرعية الفرعية والترجمة الخلفي مع نموذج محول (قاعدة)، وتحقيق نتائج جيدة على مجموعات التقييم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا