ترغب بنشر مسار تعليمي؟ اضغط هنا

أدوات البناء لإزالة المعلومات الحساسة مثل الأسماء الشخصية والعناوين وأرقام الهواتف - ما يسمى بالمعلومات الصحية المحمية (PHI) - من النص الحر الإكلينيكي هي مهمة مهمة لجعل النصوص السريرية متاحة للبحث. يجب تقييم هذه أدوات تحديد الهوية فيما يتعلق بجودتها في شكل دقة القياسات وإعادة الاتصال. لتقييم هذه الأدوات، يجب أن تكون معايير الذهب - النص السريري المشروح - يجب أن تكون متاحة. هذه المعايير الذهبية موجودة لغات أكبر. للنرويجية، ماذا - على الإطلاق، لا توجد هذه الموارد. لذلك، تم تمديد كوربوس الإكلينيكي الاصطناعية النرويجية الموجودة بالفعل، Norsynthclinical، مع فيس ومشروحة من قبل اثنين من الناحيين، والحصول على اتفاقية مشتركة بين المعجبين بقيمة 0.94 F1. في المجموع، يحتوي Corpus على 409 حيلة فاي مشروحة وتسمى Norsynthclinical Phi. تم تطوير وتدريب الأداة الهجينة لإلغاء تحديد (تعلم الآلة والبيانات المستندة إلى القواعد) على النرويجية بالموارد المفتوحة المتاحة، وحصلت على تدبير إجمالي F1 من 0.73 واستدعاء 0.62، عند اختباره باستخدام Norsynthclinicalical Phi. يتم فتح Phi Norsynthclinical Phi ومتاحا في Github لاستخدامها من قبل مجتمع البحث.
إلغاء تحديد الهوية هي مهمة اكتشاف الكيانات المتعلقة بالخصوصية في النص، مثل أسماء الشخص ورسائل البريد الإلكتروني ومعلومات الاتصال.لقد درست جيدا داخل المجال الطبي.تتزايد الحاجة إلى تكنولوجيا تحديد الهوية، حيث أن التعامل مع البيانات المحفوظة للخصوصية في ارتفاع الطلب في العديد من المجالات.في هذه الورقة، نركز على منشورات الوظيفة.نقدم JobStack، وهي تجسد جديدة لإلغاء تحديد البيانات الشخصية في الوظائف الشاغرة على Stackoverflow.نقدم خطوط أساس، ومقارنة الذاكرة الطويلة الأجل (LSTM) ونماذج المحولات.لتحسين هذه الأساس، نقوم بتجربة تمثيلات Bert، والبيانات المساعدة ذات الصلة بصراحة عبر التعلم متعدد المهام.تظهر نتائجنا أن البيانات الإضافية تساعد في تحسين أداء تحديد الهوية.أثناء تحسين تمثيلات BERT تحسين الأداء، تحولت بيرت فانيليا بشكل مدهش إلى أن تكون أكثر فعالية من بيرت المدربين على البيانات المتعلقة ب Stackoverflow.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا