ترغب بنشر مسار تعليمي؟ اضغط هنا

يستخدم تطبيع المفهوم الطبي الحيوي (BCN) على نطاق واسع في معالجة النص الطبية الحيوية كوحدة أساسية.بسبب العديد من المتغيرات السطحية للمفاهيم الطبية الحيوية، لا يزال BCN صعبا وغير مستمر.في هذه الورقة، نمستحم فرطيات المفهوم الطبية الحيوية لتسهيل BCN.نقتر ح Norkizer مفهوم الطبية الطبية الحيوية مع فرط النعاطات (BCNH)، وهو إطار جديد يتبنى تدريبات قائمة في القائمة للاستفادة من كل من الارتباطات والنظارات المرادفات، وتوظف أيضا قيود المعايير على تمثيل أزواج كيان Hypernym-Hypernym-hyponymy.تظهر النتائج التجريبية أن BCNH تتفوق على نموذج الحالة السابقة في مجموعة بيانات NCBI.
في الطبعة السادسة من المهمة الطبية الحيوية WMT، تناولنا إجمالي ثماني أزواج لغوية، وهي الإنجليزية / الألمانية، الإنجليزية / الفرنسية، الإنجليزية / الإسبانية، الإنجليزية / البرتغالية، الإنجليزية / الصينية، الإنجليزية / الروسية، الإنجليزية / الإيطالية، والإنجليزية/ الباسك.علاوة على ذلك، كانت اختباراتنا تتألف من ثلاثة أنواع من مجموعات الاختبارات النصية.جديد من هذا العام، أصدرنا مجموعة اختبار من ملخصات تجارب الحيوانات، بالإضافة إلى مجموعات الاختبار من الملخصات والمواصفات العلمية.تلقينا 107 طلبا من 15 فريقا من 6 دول.
إن ربط الكيانات الطبية الحيوية هي مهمة ربط الكيان في وثيقة طبيب طبيعية إلى كيانات مرجعية في قاعدة المعرفة. في الآونة الأخيرة، تم تقديم العديد من النماذج القائمة على بيرت للمهمة. في حين أن هذه النماذج تحقق نتائج تنافسية على العديد من مجموعات البيانات، فإنها باهظة الثمن بشكل حسابي وتحتوي على حوالي 110 مليون معلمة. لا يعرف القليل عن العوامل التي تساهم في أدائها المثيرة للإعجاب وما إذا كانت هناك حاجة إلى المعلمة الإفراطية. في هذا العمل، ألقينا بعض الضوء على الأعمال الداخلية لهذه النماذج الكبيرة القائمة على بيرت. من خلال مجموعة من التجارب التحقيق، وجدنا أن كيان يربط الأداء يتغير فقط قليلا عند خلط ترتيب كلمات الإدخال أو عندما يقتصر نطاق الانتباه على حجم نافذة ثابتة. من هذه الملاحظات، نقترح شبكة عصبية نفعية فعالة مع وصلات متبقية لربط الكيانات الطبية الحيوية. نظرا لخصائص التوصيلية المتناثرة وتقاسم الوزن، يحتوي نموذجنا على عدد صغير من المعلمات وهو فعال للغاية. على خمسة مجموعات بيانات عامة، يحقق نموذجنا القابل للمقارنة أو حتى أفضل ربط بدقة من النماذج القائمة على بيرت من أحدث المعلمات التي تضم حوالي 60 مرة معايير أقل من 60 مرة.
إن أنظمة الإجابة على السؤال الطبي (QA) لديها القدرة على الرد على أوجه عدم اليقين للأطباء حول العلاج والتشخيص عند الطلب، على علم بأحدث الأدلة.ومع ذلك، على الرغم من التقدم الكبير في عام ضمان الجودة التي أدلى بها مجتمع NLP، لا تزال أنظمة ضمان الجودة الط بية تستخدم على نطاق واسع في البيئات السريرية.أحد الأسباب المحتملة لهذا هو أن الأطباء قد لا يرجعون بسهولة مخرجات نظام ضمان الجودة، جزئيا لأن الشفافية والثقة بالثقة، ولم تكن الأصل اعتبارات رئيسية في تصميم هذه النماذج.في هذه الورقة، نناقش مجموعة من المعايير التي، إذا التقت، فمن المرجح أن تزيد من المرجح أن تزيد من فائدة أنظمة ضمان الجودة الطبية الحيوية، والتي قد تؤدي بدورها إلى اعتماد هذه النظم في الممارسة العملية.نقوم بتقييم النماذج والمهام والموادات الموجودة فيما يتعلق بهذه المعايير وتسليط الضوء على أوجه القصور من الأساليب المقترحة سابقا والشديد نحو ما قد يكون أكثر قدرة للاستخدام من أنظمة ضمان الجودة.
إن النمو السريع في التجارب السريرية المنشورة يجعل من الصعب الحفاظ على مراجعات منهجية محدثة، والتي تتطلب إيجاد جميع التجارب ذات الصلة. وهذا يؤدي إلى اتخاذ القرارات السياسية والممارسة بناء على مجموعة فرعية خارجية وغير كاملة منحازة من الأدلة السريرية ال متاحة. قد يكون استخراج ثم تطبيع السكان والتدخل والمقارنة والمقارنة والنتيجة (PICO) من مقالات التجريبية السريرية طريقة فعالة لتعيين التجارب التلقائية تلقائيا لمراجعات منهجية وتجنب البحث والفحص --- أكثر عمليات المراجعة المنهجية التي تستغرق وقتا طويلا. نقترح واختبار نهج رواية للكشف عن SPAN. الفرق الرئيسي بين أسلوبنا المقترح والنهج السابقة يأتي من اكتشاف المواقف دون الحاجة إلى بيانات تمدد المشروح واستخدام التعليقات التوضيحية على مستوى الجملة الجماعي فقط. تظهر التجارب على مجموعة بيانات اثنين من نتائج اكتشاف PICO Span تحقيق نتائج أعلى بكثير للتذكر عند مقارنتها بالأساليب الإشرافية بالكامل مع اكتشاف جملة بيكو على الأقل جيدة مثل التوضيح البشرية. من خلال إزالة الاعتماد على التعليقات التوضيحية للخبراء للكشف عن SPAN، يمكن استخدام هذا العمل في خط أنابيب رشاشيا لتحويل التوضيحات بيكو ذات الجودة المنخفضة ذات المستوى الخشفي والجمدية إلى معلومات منظمة يمكن استخدامها بسرعة لتعيين التجارب بشكل منهجي مراجعات.
إن غرس المعرفة الواقعية في النماذج المدربة مسبقا أمر أساسي للعديد من المهام المكثفة المعرفة.في هذه الورقة، اقترحنا مزيج الأقسام (MOP)، نهج التسريب يمكنه التعامل مع الرسم البياني المعرفي كبير جدا (KG) من خلال تقسيمه إلى الرسوم البيانية الفرعية الأصغر وفسر معرفتهم المحددة في نماذج بخير مختلفة باستخدام محولات خفيفة الوزن.للاستفادة من المعرفة الواقعية الشاملة للمهمة المستهدفة، فإن محولات هذه الرسوم البيانية الفرعية يتم ضبطها بشكل جيد بالإضافة إلى التقدم الأساسي من خلال طبقة خليط.نقوم بتقييم ممسحنا بثلاثة بريرز الطبية الحيوية (Scibert، BioBert، Pubmedbert) على ستة مهام (Inc. NLI، QA، التصنيف)، وإظهار النتائج أن ممسحنا يعزز باستمرار القصصات الأساسية في أداء المهام، وتحقق عروض سوتا الجديدةفي خمس مجموعات بيانات تقييمها.
في هذه الورقة، نقدم نظام FJWU مقدم إلى المهمة المشتركة الطبية الحيوية في WMT21.أعدت أنظمة الترجمة الآلية العصبية متعددة اللغات لمدة ثلاث لغات (أي الألمانية والإسبانية والفرنسية) مع اللغة الإنجليزية كلغة مستهدفة.تم تدريب أنظمة NMT الخاصة بنا المستندة إلى بنية المحولات، على مجموعة من كورسيا الموازية داخل المجال والخروج المستخدمة باستخدام تقنيات استرجاع المعلومات (IR) وتقنيات تكيف المجال.
تصف هذه الورقة أنظمة Fujitsu Dmath المستخدمة لترجمة WMT 2021، ومهام الترجمة الطبية الحيوية.ركزنا على أزواج منخفضة الموارد، باستخدام نظام بسيط.أجرينا تجارب على اللغة الإنجليزية هوسا، Xhosa-Zulu والإنجليزية-الباسك، وقدمت نتائج Xhosa → Zulu في مهمة ترجم ة الأخبار، والإنجليزية → الباسك في مهمة الترجمة الطبية الحيوية، ومصادر الترجمة التابعة للمصطلح والمصطلحات.يجمع نظامنا بين تسرب BPE، ميزات الكلمات الفرعية الفرعية والترجمة الخلفي مع نموذج محول (قاعدة)، وتحقيق نتائج جيدة على مجموعات التقييم.
يزداد عدد الوثائق الطبية الحيوية بسرعة.وفقا لذلك، يتزايد الطلب على استخراج المعرفة من النصوص الطبية الحيوية على نطاق واسع.تعرف النماذج القائمة على بيرت بأدائها عالية في المهام المختلفة.ومع ذلك، غالبا ما يكون باهظ الثمن بشكل حسابي.بيئة GPU متطورة غير متوفرة في العديد من المواقف.لتحقيق كل من الدقة عالية وسرعة الاستخراج السريع، نقترح مجموعات من النماذج المبهب المدربة مسبقا.تتفوق طريقةنا على أحدث طراز أحدث نماذج ومقرها بيرت على جاد كوربوس.بالإضافة إلى ذلك، تظهر طريقةنا بسرعة ما يقرب من ثلاث مرات سرعة استخراج أسرع من النماذج القائمة على Bert
الكيانات الطبية الحيوية المسماة معقدة، لذلك تم استخدام مطابقة تقريبية لتحسين تغطية الكيان.ومع ذلك، فإن نهج المطابقة التقريب المعتادة يجلب نتيجة مطابقة واحدة فقط، والتي غالبا ما تكون صاخبة.في هذا العمل، نقترح طريقة لنقل الطبية الحيوية التي يجلب مباريا ت تقريبية متعددة لجملة معينة للاستفادة من أشكالها لتقدير تشابه الكيان.يستخدم النموذج تجمع لتجاهل المعلومات غير الضرورية من نتائج المطابقة الصاخبة، وتعلم كيان تشابه العبارة مع العديد من المباريات التقريبية.النتائج التجريبية على ثلاثة مجموعات بيانات معطرة من المجال الطبي الطبيعي، BC2GM، مرض NCBI، و BC4Chemd، إظهار الفعالية.يعمل نموذجنا في تحسين المتوسط بنسبة تصل إلى +0.21 نقطة مقارنة مع NER القائم على BIOBERT.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا