ترغب بنشر مسار تعليمي؟ اضغط هنا

إنشاء وتقييم كوربوس السريرية النرويجية الاصطناعية لإلغاء تحديد

Creating and Evaluating a Synthetic Norwegian Clinical Corpus for De-Identification

247   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أدوات البناء لإزالة المعلومات الحساسة مثل الأسماء الشخصية والعناوين وأرقام الهواتف - ما يسمى بالمعلومات الصحية المحمية (PHI) - من النص الحر الإكلينيكي هي مهمة مهمة لجعل النصوص السريرية متاحة للبحث. يجب تقييم هذه أدوات تحديد الهوية فيما يتعلق بجودتها في شكل دقة القياسات وإعادة الاتصال. لتقييم هذه الأدوات، يجب أن تكون معايير الذهب - النص السريري المشروح - يجب أن تكون متاحة. هذه المعايير الذهبية موجودة لغات أكبر. للنرويجية، ماذا - على الإطلاق، لا توجد هذه الموارد. لذلك، تم تمديد كوربوس الإكلينيكي الاصطناعية النرويجية الموجودة بالفعل، Norsynthclinical، مع فيس ومشروحة من قبل اثنين من الناحيين، والحصول على اتفاقية مشتركة بين المعجبين بقيمة 0.94 F1. في المجموع، يحتوي Corpus على 409 حيلة فاي مشروحة وتسمى Norsynthclinical Phi. تم تطوير وتدريب الأداة الهجينة لإلغاء تحديد (تعلم الآلة والبيانات المستندة إلى القواعد) على النرويجية بالموارد المفتوحة المتاحة، وحصلت على تدبير إجمالي F1 من 0.73 واستدعاء 0.62، عند اختباره باستخدام Norsynthclinicalical Phi. يتم فتح Phi Norsynthclinical Phi ومتاحا في Github لاستخدامها من قبل مجتمع البحث.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نطور Sindhi معجم شخصي باستخدام دمج الموارد الإنجليزية القائمة: NRC Lexicon، قائمة كلمات الرأي، Sentiwordnet، Sindhi-English Dictionary، وجمع معدلات Sindhi.يتم تعيين درجة المشاعر الإيجابية أو السلبية لكل كلمة sindhi رأي.بعد ذلك، نحدد تغ طية المعجم المقترح مع تحليل الذاتية.علاوة على ذلك، نحن الزحف من سقسقة المجال سقسقة من الأخبار والرياضة والتمويل.يتم تفجيح Crescus Corpus من قبل Annetators ذوي الخبرة باستخدام أداة توضيح النص Doccano.يتم تقييم المشاعر المشروحة Corpus من خلال توظيف آلة ناقلات الدعم (SVM)، والشبكات العصبية المتكررة (RNN)، والشبكة العصبية التنافسية (CNN).
يسعى مركز الترجمة الظاهري الوطني (NVTC) إلى الحصول على أدوات تكنولوجيا اللغة البشرية (HLT) التي ستسهل مهمتها لتوفير ترجمات حرفية باللغة الإنجليزية لملفات الصوت والفيديو اللغوية.في المجال النصي، تستخدم NVTC ذاكرة الترجمة (TM) لبعض الوقت وقد أبلغت عن د مج الترجمة الآلية (MT) في سير العمل (Miller et al.، 2020).بينما لقد استكشفنا استخدام ترجمة الكلام (STT) وترجمة الكلام (stt) في الماضي (Tzoukermann و Miller، 2018)، فقد استثمرنا الآن في إنشاء كائن كبير من البشر من صنع الإنسان لتقييم بدائل بدقة.النتائج من تحليلنا لهذه الشقوق وأداء أدوات HLT تشير إلى الطريق إلى الأكثر واعدة للنشر في سير العمل لدينا.
تقدم هذه الورقة Norecneg - مجموعة بيانات النفي الأولى المشروح للنرويجية.تم تفاح الإشارات النفي والعنوان الواحدة في الجملة عبر أكثر من 11 ألف جمل تمتد أكثر من 400 وثيقة لمجموعة فرعية من الاستعراض النرويجي Corpus (Norec).بالإضافة إلى تقديم مناقشة متعمق ة للمبادئ التوجيهية التوضيحية، نقدم أيضا مجموعة أولى من النتائج القياسية المستندة إلى نهج بياني لتحليل الرسم البياني.
تصف هذه الورقة معيارا متاحا بحرية على شبكة الإنترنت يسمى HB DEID.تحدد DED HB ما يسمى بالمعلومات الصحية المحمية، PHI، في نص مكتوب باللغة السويدية والأقنعة أو استبدالها مع بدائل أو سرية.يتم تسمية فيس كيانات مثل الأسماء الشخصية والمواقع والأعمار وأرقام الهواتف والتواريخ.يستخدم HB DEID نموذجا CRF مدرب على النص المشروح غير الحساسة في السويدية، بالإضافة إلى خطوة ما بعد معالجة القواعد لإيجاد فاي.الخطوة الأخيرة في غامضة PHI هي إما قناعها، إظهار اسم الفصل أو استخدام نظام الكشف عن القواعد لاستبداله.
تعد التعميم المرتبطة مشكلة معروفة في الكشف عن الموقف (SD)، حيث تميل النظم إلى الأداء بشكل سيئ عند تعرضها للأهداف غير المرئية أثناء التدريب.بالنظر إلى أن شرح البيانات باهظ الثمن وتستغرق وقتا طويلا، فإن إيجاد طرق للاستفادة من البيانات غير المستقرة غير المسبقة يمكن أن تقدم فوائد كبيرة.في هذه الورقة، نطبق إطارا إشرافه ضعيفا لتعزيز التعميم الشامل من خلال البيانات المشروحة بتهمة التوحيد.نحن نركز على Twitter SD وإظهار تجريبيا من أن دمج البيانات الاصطناعية مفيدة للتعميم الشامل، مما يؤدي إلى تحسينات كبيرة في الأداء، مع المكاسب في درجات F1 تتراوح بين +3.4 إلى +5.1.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا