ترغب بنشر مسار تعليمي؟ اضغط هنا

وصف الملصقات المستندة إلى وصف التصنيف لتصنيف ICD-9 للتفسير

Description-based Label Attention Classifier for Explainable ICD-9 Classification

101   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

ترميز ICD-9 هي مهمة الفواتير السريرية ذات الصلة، حيث يتم تفاحص النصوص غير المنظمة مع معلومات حول تشخيص وعلاجات المريض مع رموز ICD-9 متعددة.الترميز الآلي ICD-9 هو حقل بحث نشط، حيث تمثل الهندسة النموذجية القائم على CNN و RNN النهج الحديثة من بين الفن.في هذا العمل، نقترح تصنيف اهتمام الملصقات القائمة على الوصف لتحسين الشريحة النموذجية عند التعامل مع النصوص الصاخبة مثل الملاحظات السريرية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يمكن أن تكون مشاكل تصنيف المستندات متعددة الملصقات (MLDC) تحديا، خاصة بالنسبة للمستندات الطويلة ذات مجموعة علامات كبيرة وتوزيع ذيل طويل على الملصقات. في هذه الورقة، نقدم شبكة اهتمام نفعية فعالة لمشكلة MLDC مع التركيز على تنبؤ الكود الطبي من الوثائق ا لسريرية. ابتكاراتنا هي ثلاثة أضعاف: (1) نستخدم تشفير عميق يستند إلى الارتفاع مع شبكات الضغط والإثارة والشبكات المتبقية لتجميع المعلومات عبر الوثيقة وتعلم تمثيلات وثيقة ذات مغزى تغطي نطاقات مختلفة من النصوص؛ (2) نستكشف الانتباه متعدد الطبقات ومجموعة إيلاء الاهتمام لاستخراج الميزات الأكثر تفاعيمية من هذه التمثيلات متعددة النطاق؛ (3) نجمع بين خسارة انتروبيا الصليب الثنائية وفقدان البؤري لتحسين الأداء للعلامات النادرة. نحن نركز دراسة تقييمنا على MIMIC-III، مجموعة بيانات واستخدامها على نطاق واسع في المجال الطبي. تتفوق نماذجنا على العمل السابق على الترميز الطبي وتحقيق نتائج جديدة من الفنون الجديدة على مقاييس متعددة. كما نوضح أيضا الطبيعة المستقلة للغة لنهجنا من خلال تطبيقها على مجموعة بيانات غير الإنجليزية. يتفوق النموذج الخاص بنا على أفضل نموذج مسبق ونموذج محول متعدد اللغات من هامش جوهري.
يعمل العمل الحديث على تصنيف المعنويات على مستوى جانب الجساب شبكات اتصالا بيانيا (GCN) على أشجار التبعية لتعلم التفاعلات بين شروط الارتفاع وكلمات الرأي. في بعض الحالات، لا يمكن الوصول إلى كلمات الرأي المقابلة لمصطلح الجانب داخل القفزتين على أشجار التب عية، والتي تتطلب المزيد من طبقات GCN إلى النموذج. ومع ذلك، غالبا ما تحقق GCNS أفضل أداء بطبقتين، ولا تحقق GCNs أعمق أي مكسب إضافي. لذلك، نقوم بتصميم نماذج GCN الانتباه الانتقائية الجديدة. من ناحية، يتيح النموذج المقترح التفاعل المباشر بين شروط الجانب وكلمات السياق عن طريق عملية الانتباه الذاتي دون تحديد المسافة على أشجار التبعية. من ناحية أخرى، تم تصميم إجراء اختيار Top-K لتحديد كلمات الرأي عن طريق تحديد كلمات سياق K مع أعلى درجات الاهتمام. نقوم بإجراء تجارب على عدة مجموعات بيانات معيار شائعة الاستخدام وتظهرت النتائج أن SA-GL-GCN المقترح تفوق نماذج أساسية قوية.
بالنظر إلى الملاحظات السريرية المكتوبة في السجلات الصحية الإلكترونية (EHRS)، فمن الصعب التنبؤ برموز التشخيص التي يتم صياغة مهمة تصنيف متعدد العلامات.مجموعة كبيرة من الملصقات، والاعتماد الهرمي، والبيانات غير المتوازنة تجعل مهمة التنبؤ هذه صعبة للغاية. قامت معظم الأعمال الحالية ببناء التنبؤ الثنائي لكل تسمية بشكل مستقل، مما يتجاهل التبعيات بين الملصقات.لمعالجة هذه المشكلة، نقترح إطارا من مرحلتين لتحسين ترميز ICD التلقائي عن طريق التقاط ارتباط التسمية.على وجه التحديد، ندرب مقدر توزيع مجموعة التسمية لإنقاش احتمالية كل مرشح تعيين كل ملصق تم إنشاؤه بواسطة مؤشر أساسي.هذه الورقة هي المحاولة الأولى لتعلم توزيع مجموعة التسمية كوحدة Reranking لترميز ICD.في التجارب، يكون إطار عملنا المقترح قادرا على تحسين تنبؤات أفضل أداء لتنبؤ الكود الطبي في مجموعات البيانات المقلدة القياسية.
تناقش هذه الورقة المهمة المشتركة لمصطلحات WMT 2021 من منظور "Meta".نقدم نتائج تجاربنا باستخدام مجموعة بيانات المصطلحات و OpenNMT (Klein et al.، 2017) و Joeynmt (Kreutzer et al.، 2019) Toolkits لاتجاه اللغة الإنجليزية إلى الفرنسية.تجربتنا 1 يقارن تنبؤ ات مجموعة الأدوات.تستخدم التجربة 2 OpenNMT لضبط النموذج.نبلغ عن نتائجنا للحصول على المهمة مع البرنامج النصي التقييم ولكن في الغالب مناقشة الخصائص اللغوية لمجموعة بيانات المصطلحات المقدمة للمهمة.نحن نقدم دليلا على أهمية أنواع الأنواع النصية عبر الدرجات، بعد أن تم تكرار البرامج النصية للتقييم.
في تجربة حالية، كنا نقوم باختبار DataSet Commongen للمهمة الهيكلية إلى النص من GEM Living Benchmark مع نموذج مؤشر القيد القائم.يمثل المؤشر هندسة هجينة، والجمع بين النماذج القائمة على الإدراج والمحول، والتنبؤ بالكمية وموقع الإدراج في نفس الوقت.لذلك يت م إنشاء النص تدريجيا بطريقة غير متوازية غير تلقائية، بالنظر إلى مجموعة الكلمات الرئيسية.كان النموذج المحدد ضبطه بشكل جيد على تقسيم تدريب لمجموعة بيانات Commungen وتم مقارنة نتيجة الجيل بالتحقق من الصحة والتحدي.تتم مناقشة مخرجات المقاييس المستلمة، والتي تقيس المعادلات المعجمية، التشابه الدلالي والتنوع، في التفاصيل في وصف النظام الحالي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا