التحول التلقائي للروايات السريرية إلى تنسيق منظم


الملخص بالعربية

تتوفر كميات هائلة من البيانات في مجال الرعاية الصحية بتنسيق نص غير منظم، عادة باللغة المحلية للبلدان. تحتوي هذه المستندات على معلومات قيمة. الاستخدام الثانوي للسرد السريري واستخراج المعلومات من الحقائق والعلاقات الرئيسية منها حول تاريخ مرض المريض يمكن أن تعزز الطب الوقائي وتحسين الرعاية الصحية. في هذه الورقة، نقترح طريقة هجينة للتحول التلقائي للنص السريري إلى تنسيق منظم. يتم التقسيم الوثائق تلقائيا في الأجزاء التالية: التشخيص، تاريخ المريض، حالة المريض، نتائج المختبرات. بالنسبة لقسم التشخيص "يتم تطبيق ترميز التعلم العميق النصي في رموز ICD-10 باستخدام MBG-Clinicalbert - نموذج Clinicalbert المصنف من الناعم للنص الطبي البلغاري. من قسم "تاريخ المريض"، نحدد أعراض المريض باستخدام نهج يستند إلى القواعد معززة مع بحث التشابه بناء على Adgeddings Word MBG-Clinicalbert. ونحن نحدد أيضا علاقات الأعراض مثل النفي. بالنسبة لوصف حالة المريض "" وصف، يتم استخدام التصنيف الثنائي لتحديد حالة كل عضو تشريحي. في هذه الورقة، نوضح طرق مختلفة لتكييف أدوات NLP للغة الإنجليزية واللغات الأخرى لغات موارد منخفضة مثل البلغارية.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث