أدوات البناء لإزالة المعلومات الحساسة مثل الأسماء الشخصية والعناوين وأرقام الهواتف - ما يسمى بالمعلومات الصحية المحمية (PHI) - من النص الحر الإكلينيكي هي مهمة مهمة لجعل النصوص السريرية متاحة للبحث. يجب تقييم هذه أدوات تحديد الهوية فيما يتعلق بجودتها في شكل دقة القياسات وإعادة الاتصال. لتقييم هذه الأدوات، يجب أن تكون معايير الذهب - النص السريري المشروح - يجب أن تكون متاحة. هذه المعايير الذهبية موجودة لغات أكبر. للنرويجية، ماذا - على الإطلاق، لا توجد هذه الموارد. لذلك، تم تمديد كوربوس الإكلينيكي الاصطناعية النرويجية الموجودة بالفعل، Norsynthclinical، مع فيس ومشروحة من قبل اثنين من الناحيين، والحصول على اتفاقية مشتركة بين المعجبين بقيمة 0.94 F1. في المجموع، يحتوي Corpus على 409 حيلة فاي مشروحة وتسمى Norsynthclinical Phi. تم تطوير وتدريب الأداة الهجينة لإلغاء تحديد (تعلم الآلة والبيانات المستندة إلى القواعد) على النرويجية بالموارد المفتوحة المتاحة، وحصلت على تدبير إجمالي F1 من 0.73 واستدعاء 0.62، عند اختباره باستخدام Norsynthclinicalical Phi. يتم فتح Phi Norsynthclinical Phi ومتاحا في Github لاستخدامها من قبل مجتمع البحث.