ترغب بنشر مسار تعليمي؟ اضغط هنا

دمج دلالات أعلى مستوى في تمثيلات اسم طبية طبية

Integrating Higher-Level Semantics into Robust Biomedical Name Representations

175   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

عادة ما تعتبر التشفير العصبي للأسماء الطبية الحيوية قوية إذا تم استغلال التمثيلات بشكل فعال لمختلف مهام NLP المصب المختلفة. لتحقيق ذلك، تحتاج المشفر إلى نموذج الدلالات الطبية الحيوية خاصة بالمجال مع تنافس التطبيق العالمي للتطبيق العالمي للإشراف على الإشراف على الذات. ركز العمل السابق بشأن التمثيلات القوية على تعلم الفروق المنخفضة المستوى بين أسماء المفاهيم الطبية الحيوية المحبوبة. يمكن أيضا تجميع هذه المفاهيم الرخيصة هذه معا لتعكس التفرقات الدلالية عالية المستوى والأكثر إنشيا، مثل تجميع أسماء اللحام اللدغة والحمى التي تنقلها القراد معا بموجب وصف ثقب الجلد. لم يتم تأكيده من التجريبية حتى الآن أن التدريب على ترميز الأسماء الطبية الحيوية على التمييز الدقيق يؤدي تلقائيا إلى الترميز من أسفل إلى أسفل من هذه الدلالات ذات المستوى الأعلى. في هذه الورقة، نظير على أن هذا التأثير القاع موجودا، لكنه لا يزال محدودا نسبيا. كحل، نقترح نظام تدريب متعدد المهام القابل للتوسيع لترميز الاسم الطبي الطبيعي الذي يمكن أن يتعلم أيضا تمثيلات قوية باستخدام فصول دلالية عالية المستوى فقط. هذه التمثيلات يمكن أن تعميم كل من القمة المتابعة وكذلك من أعلى إلى أسفل بين مختلف التسلسلات الدلالية. علاوة على ذلك، نوضح كيف يمكن استخدامها خارج الصندوق لتحسين الكشف غير المدعوم من الارتفاع غير المرغوب فيها، مع الاحتفاظ بأداء قوي على مختلف معايير المرتبطة الدلالية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

التنبؤ بالعلامة المستنيرة عن مجموعة من النصوص وقواعد المعرفة المنوية، يجمع بين إكمال الرسوم البيانية المعرفة مع استخراج العلاقات، هي مهمة درس صغيرة نسبيا.النظام الذي يمكن أن يؤدي هذه المهمة له القدرة على تمديد مجموعة تعسفية من جداول قاعدة البيانات ال علائقية مع المعلومات المستخرجة من Corpus Document.يتناول OpenKi [1] هذه المهمة من خلال استخراج الكيانات المسماة ويستند عبر أدوات Openie، ثم تعلم تضمين العلاقات من الرسم البياني لعلاقة الكيانات الناتجة عن التنبؤ بالعلاقة، مما يتفوق على النهج السابقة.نقدم امتدادا من Openki الذي يشتمل على مذكرات من التمثيلات القائمة على النصوص للكيانات والعلاقات.نوضح أن هذا يؤدي إلى زيادة كبيرة في الأداء على نظام دون هذه المعلومات.
في حين أن الكثير من الأبحاث قد تم في توليف الرسائل النصية إلى صورة، فقد تم إجراء القليل من العمل لاستكشاف استخدام الهيكل اللغوي لنص المدخلات. هذه المعلومات أكثر أهمية بالنسبة لتصور القصة لأن مدخلاتها لها هيكل سرد صريح يحتاج إلى ترجمة إلى تسلسل الصورة (أو قصة مرئية). أظهر العمل المسبق في هذا المجال أن هناك مجالا واسعا للتحسين في تسلسل الصور الناتج من حيث الجودة البصرية والاتساق والأهمية. في هذه الورقة، نستكشف أولا استخدام أجهزة تحليل الدائرة باستخدام بنية متكررة قائمة على المحولات لترميز المدخلات المهيكلة. ثانيا، نشجع المدخلات المنظمة مع معلومات المنطقية ودراسة تأثير هذه المعرفة الخارجية على جيل القصة البصرية. ثالثا، نحن أيضا دمج البنية المرئية عبر المربعات المحيطة والتسمية الكثيفة لتوفير ملاحظات حول الأحرف / الكائنات في الصور التي تم إنشاؤها داخل إعداد تعليمي مزدوج. نظهر أن نماذج التسمية الكثيفة غير الرفية التي تم تدريبها على جينوم المرئي يمكن أن تحسن الهيكل المكاني للصور من مجال مستهدف مختلف دون الحاجة إلى ضبط جيد. نحن ندرب طراز النموذج باستخدام فقدان داخل القصة داخل القصة (بين الكلمات والمناطق الفرعية للصور) وإظهار تحسينات كبيرة في الجودة البصرية. أخيرا، نحن نقدم تحليلا للمعلومات اللغوية والمكانية.
تحتوي نماذج الترجمة الآلية على مفردات منفصلة واستخدام تقنيات تجزئة الكلمات الفرعية لتحقيق المفردات المفتوحة.يعتمد هذا النهج على تسلسل Unicode متسق وصحيح، ويجعل النماذج عرضة للتدهور من الأنواع المشتركة من الضوضاء والاختلاف.بدافع من متانة معالجة اللغات البشرية، نقترح استخدام تمثيلات نصية بصرية، والذي يتم الاستغناء عن مجموعة محدودة من Adgeddings النصية لصالح المفردات المستمرة التي تم إنشاؤها عن طريق معالجة النص المنصوص عليه بصريا مع Windows Sliding Windows.نظهر أن النماذج باستخدام نهج تمثيلات النص المرئي أو مطابقة أداء النماذج النصية التقليدية على مجموعات البيانات الصغيرة والأكبر.الأهم من ذلك، الأهم من ذلك، توضح النماذج ذات المدينات البصرية متانة كبيرة لأنواع الضوضاء المتنوعة، وتحقيق على سبيل المثال، 25.9 بلو على شخصية مسموعة باللغة الألمانية - المهمة الإنجليزية حيث تتحلل نماذج الكلمات الفرعية إلى 1.9.
عادة ما يتم تدريب نماذج اللغات الحالية على استخدام مخطط للإشراف على الذات، حيث يركز التركيز الرئيسي على التعلم في كلمة البرنامج أو مستوى الجملة.ومع ذلك، كان هناك تقدم محدود في توليد تمثيلات مفيدة على مستوى الخطاب.في هذا العمل، نقترح استخدام الأفكار م ن نظرية الترميز التنبؤية لزيادة نماذج اللغة ذات طراز بيرت مع آلية تسمح لهم بتعلم تمثيلات مناسبة على مستوى الخطاب.نتيجة لذلك، يكون نهجنا المقترح قادرا على التنبؤ بالأحكام المستقبلية باستخدام اتصالات واضحة من أعلى إلى أسفل تعمل في الطبقات المتوسطة للشبكة.من خلال تجربة معايير مصممة لتقييم المعرفة المتعلقة بالحبال باستخدام تمثيلات الجملة المدربة مسبقا، نوضح أن نهجنا يحسن الأداء في 6 من أصل 11 مهام من خلال التميز في كشف علاقة الخطاب.
نقدم المهمة الجديدة لحل النزاعات اسم النطاق (DNDR)، والذي يتنبأ بنتيجة عملية لحل النزاعات حول استحقاق قانوني لاسم النطاق.يحدد TheICann UDRP عملية تحكيم إلزامية للنزاع بين مالك العلامة التجارية وسجل اسم النطاق المتعلق باسم مجال كبير المستوى (GTLD) (GT LD) (واحد ينتهي في .com، .org، .NET، إلخ).يؤدي طبيعة المشكلة إلى مجموعة بيانات متحفة للغاية، والتي تنبع من القدرة على تسجيل اسم مجال مع سهولة شديدة، ومصروفات قليلة للغاية، ولا حاجة لإثبات استحقاقها.في هذه الورقة، نحن تصف ثيتاسك ومجموعة البيانات المرتبطة بها.ونحن نقدم أيضا نتائج مرجعية بناء على مجموعة من MOD-ELS، والتي تظهر أن خطوط الأساس البسيطة بشكل عام صعبة التغلب عليها بسبب توزيع البيانات المنحرفة، ولكن في حالة المستفتى المحددة التي قدمت استجابة، برت ضبط صقليقدم النموذج تحسينات كبيرة على نموذج فئة الأغلبية

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا