ترغب بنشر مسار تعليمي؟ اضغط هنا

Ensidnet: شبكة Siamese الهجينة المحسنة للتجميع التجارب السريرية لتجميع مسارات تطوير المخدرات

EnSidNet: Enhanced Hybrid Siamese-Deep Network for grouping clinical trials into drug-development pathways

293   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تم استخدام الشبكات العصبية السيامية على نطاق واسع لأداء تصنيف التشابه في إعدادات متعددة الطبقات.يمكن استخدام بنيةهم لجماعة التجارب السريرية التي تنتمي إلى نفس مسار تنمية المخدرات على طول المراحل المحاكمة السريرية العديدة.هنا نقدم نهجا للحاجة غير الملباة لإعادة إعمار مسار تنمية المخدرات، استنادا إلى شبكة عميقة محسنة في العمل العصبي الهجين (Ensidnet).يوضح النموذج المقترح تحسنا كبيرا فوق خط الأساس في إعداد تقييم طلقة واحدة وفي إعداد التشابه الكلاسيكي.يمكن أن تكون Ensidnet أداة أساسية في بيئة تعليمية شبه إشراف: من خلال تحديد التجارب السريرية من المرجح أن تنتمي إلى نفس مسار تنمية المخدرات، من الممكن تسريع عملية وضع العلامات للخبراء البشريين، مما يسمح بفحص حجم متسقالبيانات، تستخدم كذلك في مجموعة بيانات التدريب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نعتبر التمثيل الهرمي للوثائق كرسوم بيانية واستخدام التعلم العميق الهندسي لتصنيفها إلى فئات مختلفة.في حين أن الشبكات العصبية الرسم البيانية يمكن أن تتعامل مع الهيكل المتغير بشكل فعال للمستندات التسلسل الهرمية باستخدام عمليات تمرير رسالة ثابتة للصب غ، فإننا نوضح أنه يمكننا الحصول على تحسينات إضافية على الأداء باستخدام عملية تجمع الرسوم البيانية الانتقائية المقترحة التي تنشأ من حقيقة أن بعض أجزاء التسلسل الهرمي ثابتةعبر وثائق مختلفة.طبقنا نموذجنا لتصنيف بروتوكولات التجريبية السريري (CT) إلى فئات كاملة وإنهاءها.نستخدم حقيبة من الكلمات القائمة على الأكياس، بالإضافة إلى تضيير مقرها المحولات مسبقا لفصل العقد الرسم البياني، وتحقيق F1 Squareesaround 0.85 على سجل CT واسع النطاق للجمهور حول بروتوكولات 360k.نوضح كذلك كيف يمكن للتجمع الانتقائي إضافة رؤى في التنبؤ بحالة إنهاء CT.نحن نجعل التعليمات البرمجية المصدرية والشقاقات DataSet يمكن الوصول إليها.
يمكن أن تكون مشاكل تصنيف المستندات متعددة الملصقات (MLDC) تحديا، خاصة بالنسبة للمستندات الطويلة ذات مجموعة علامات كبيرة وتوزيع ذيل طويل على الملصقات. في هذه الورقة، نقدم شبكة اهتمام نفعية فعالة لمشكلة MLDC مع التركيز على تنبؤ الكود الطبي من الوثائق ا لسريرية. ابتكاراتنا هي ثلاثة أضعاف: (1) نستخدم تشفير عميق يستند إلى الارتفاع مع شبكات الضغط والإثارة والشبكات المتبقية لتجميع المعلومات عبر الوثيقة وتعلم تمثيلات وثيقة ذات مغزى تغطي نطاقات مختلفة من النصوص؛ (2) نستكشف الانتباه متعدد الطبقات ومجموعة إيلاء الاهتمام لاستخراج الميزات الأكثر تفاعيمية من هذه التمثيلات متعددة النطاق؛ (3) نجمع بين خسارة انتروبيا الصليب الثنائية وفقدان البؤري لتحسين الأداء للعلامات النادرة. نحن نركز دراسة تقييمنا على MIMIC-III، مجموعة بيانات واستخدامها على نطاق واسع في المجال الطبي. تتفوق نماذجنا على العمل السابق على الترميز الطبي وتحقيق نتائج جديدة من الفنون الجديدة على مقاييس متعددة. كما نوضح أيضا الطبيعة المستقلة للغة لنهجنا من خلال تطبيقها على مجموعة بيانات غير الإنجليزية. يتفوق النموذج الخاص بنا على أفضل نموذج مسبق ونموذج محول متعدد اللغات من هامش جوهري.
في الآونة الأخيرة، تم تحقيق أداء مثير للإعجاب على مختلف مهام فهم اللغة الطبيعية من خلال دمج بناء الجملة والمعلومات الدلالية في النماذج المدربة مسبقا، مثل بيرت وروبرتا.ومع ذلك، يعتمد هذا النهج على ضبط النماذج الدقيقة الخاصة بالمشكلات، وعلى نطاق واسع، تظهر نماذج BERT-يشبئون الأداء، وهي غير فعالة، عند تطبيقها على مهام مقارنة التشابه غير المدعومة.تم اقتراح الحكم - بيرت (SBERT) كطريقة تضمين عقوبة عامة للأغراض العامة، مناسبة لكل من مقارنة التشابه والمهام المصب.في هذا العمل، نظهر أنه من خلال دمج المعلومات الهيكلية في SBERT، فإن النموذج الناتج يتفوق على SBERTT وتميز الجملة العامة السابقة على مجموعات بيانات التشابه الدلالي غير المنصوص عليها ومهام تصنيف النقل.
تتوفر كميات هائلة من البيانات في مجال الرعاية الصحية بتنسيق نص غير منظم، عادة باللغة المحلية للبلدان. تحتوي هذه المستندات على معلومات قيمة. الاستخدام الثانوي للسرد السريري واستخراج المعلومات من الحقائق والعلاقات الرئيسية منها حول تاريخ مرض المريض يمك ن أن تعزز الطب الوقائي وتحسين الرعاية الصحية. في هذه الورقة، نقترح طريقة هجينة للتحول التلقائي للنص السريري إلى تنسيق منظم. يتم التقسيم الوثائق تلقائيا في الأجزاء التالية: التشخيص، تاريخ المريض، حالة المريض، نتائج المختبرات. بالنسبة لقسم التشخيص "يتم تطبيق ترميز التعلم العميق النصي في رموز ICD-10 باستخدام MBG-Clinicalbert - نموذج Clinicalbert المصنف من الناعم للنص الطبي البلغاري. من قسم "تاريخ المريض"، نحدد أعراض المريض باستخدام نهج يستند إلى القواعد معززة مع بحث التشابه بناء على Adgeddings Word MBG-Clinicalbert. ونحن نحدد أيضا علاقات الأعراض مثل النفي. بالنسبة لوصف حالة المريض "" وصف، يتم استخدام التصنيف الثنائي لتحديد حالة كل عضو تشريحي. في هذه الورقة، نوضح طرق مختلفة لتكييف أدوات NLP للغة الإنجليزية واللغات الأخرى لغات موارد منخفضة مثل البلغارية.
اجتذبت حل مشكلة كلمة الرياضيات اهتماما كبيرا بحوثا كبيرا في السنوات الأخيرة. أظهرت الأعمال السابقة فعالية استخدام الشبكات العصبية الرسم البيانية لالتقاط العلاقات في المشكلة. ومع ذلك، فإن هذه الأعمال لم تأخذ بعناية معلومات تسمية الحافة وعلاقة الكلمة ا لطويلة المدى عبر الجمل في الاعتبار. بالإضافة إلى ذلك، أثناء التوليد، يركزون على أكثر المناطق ذات صلة بالكلمة التي تم إنشاؤها حاليا، مع إهمال بقية المشكلة. في هذه الورقة، نقترح نموذج رسم بياني هرمي ذو طراز ذو طراز هيروسي محسن على حافة على وجه التحديد، يتم استخدام تشفير الرسوم البيانية التسلسل الهرمية المحسنة على الحافة لدمج معلومات تسمية الحافة. يقوم هذا التشفير بتحديث عقود الرسم البياني هرمي خطوتين في خطوتين: تجميع مستوى الجملة ومجموعة على مستوى المشكلات. علاوة على ذلك، يتم تطبيق وحدة فك ترميز منظم من الأشجار مع آلية انحراف تقسيم لتوجيه النموذج للانتباه إلى أجزاء مختلفة من مشكلة الإدخال. أظهرت النتائج التجريبية على المؤشرات ومجموعات البيانات MAWPS و Math23K أن EEH-G2T يمكن أن تحسن بشكل فعال الأداء بشكل فعال مقارنة بالطرق الحديثة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا