الكشف والاضطرب: إعادة كتابة محايدة للنص المتحيز والحساسة عبر فك التشفير المستندة إلى التدرج


الملخص بالعربية

اللغة المكتوبة تحمل تحيزات صريحة وتضيعة يمكن أن تصرفت عن إشارات ذات مغزى. على سبيل المثال، قد تصف خطابات المرجعية المرشحين الذكور والإناث بشكل مختلف، أو قد تكشف أسلوب الكتابة الخاصة بهم بشكل غير مباشر عن الخصائص الديموغرافية. في أحسن الأحوال، يصرف مثل هذه التحيزات عن المحتوى المجدي للنص؛ في أسوأ الأحوال يمكن أن تؤدي إلى نتائج غير عادلة. نحن نبحث في تحدي إعادة توليد جمل مدخلات لتحييد "السمات الحساسة" مع الحفاظ على المعنى الدلالي للنص الأصلي (E.G. هو المرشح المؤهل؟). نقترح إطار إعادة كتابة واستنادا في التدرج، والكشف عن وإقلاده لتحييد (DEPEN)، الذي يكتشف أولا مكونات حساسة ويخفيهن من أجل التجديد، ثم يزعج نموذج الجيل عند فك تشفير الوقت تحت قيد تحييد يدفع التوزيع (المتوقع) سمات نحو توزيع موحد. تظهر تجاربنا في سيناريوهات مختلفة أن DEPEN يمكن أن تجدد البدائل الطوفية محايدة في السمة الحساسة مع الحفاظ على دلالات السمات الأخرى.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث