لبناء التطبيقات المستندة إلى التعلم في الآلات من أجل المجالات الحساسة مثل الطبية والقانونية، وما إلى ذلك حيث يحتوي النص الرقمي على معلومات خاصة، فإن عدم الكشف عن هويت النص مطلوب للحفاظ على الخصوصية. تسلسل العلامات، على سبيل المثال كما فعلت في التعرف
على الكيان المسمى (NER) يمكن أن تساعد في الكشف عن المعلومات الخاصة. ومع ذلك، لتدريب نماذج العلامات على التسلسل، مبلغ كافية من البيانات المسمى مطلوبة ولكن بالنسبة لمجالات حساسة الخصوصية، لا يمكن أيضا مشاركة هذه البيانات المسمى مباشرة. في هذه الورقة، يمكننا التحقيق في تطبيق إطار الحفاظ على الخصوصية لمهام علامات التسلسل، وتحديدا NER. وبالتالي، فإننا نحلل إطارا لمهمة NER، التي تتضمن مستويين لحماية الخصوصية. أولا، نقوم بنشر إطار تعليمي (FLF) الموحد حيث لا يتم مشاركة البيانات المسمى مع الخادم المركزي بالإضافة إلى عملاء الأقران. ثانيا، نطبق الخصوصية التفاضلية (DP) أثناء التدريب النماذج في كل مثيل عميل. في حين أن كلا من تدابير الخصوصية مناسبة للنماذج التي تدرك الخصوصية، فإن تركيبة النتائج في النماذج غير المستقرة. لمعرفةنا، هذه هي الدراسة الأولى من نوعها على نماذج علامات تسلسل الإدراك في الخصوصية.
تركز معظم دراسات حماية الخصوصية للبيانات النصية على إزالة المعرفات الحساسة الصريحة. ومع ذلك، غالبا ما يتم إهمال أسلوب الكتابة الشخصية، كمؤشر قوي على التأليف،. أظهرت الدراسات الحديثة، مثل SYNTF، نتائج واعدة حول التعدين النصي للحفاظ على الخصوصية. ومع ذ
لك، لا يمكن خلائطها المجهول فقط إخراج ناقلات المصطلحات الرقمية التي يصعب تفسير المستلمين. نقترح نموذج توليد نص جديد مع وجود آلية أسية ذات مجموعة من مجموعة إخفاء الهوية. من خلال زيادة المعلومات الدلالية من خلال وظيفة مكافأة تدريبية تعزز، يمكن أن يؤدي النموذج إلى إنشاء نص خاص بالتفاضل الذي يحتوي على بنية نحوية دلالية ومماثلة للنص الأصلي أثناء إزالة السمات الشخصية لأسلوب الكتابة. لا يفترض أي ملصقات مشروطة أو بيانات نصية متوازية للتدريب. نحن نقيم أداء النموذج المقترح في مراجعات نظر الأقران الواقعية ومجموعات بيانات مراجعة الصرخة. تشير النتيجة إلى أن نموذجنا يتفوق على أحدث حديثة من الحفظ الدلالي، ومضاءة التأليف، وتحول ستايلومتريك.