اللغة المكتوبة تحمل تحيزات صريحة وتضيعة يمكن أن تصرفت عن إشارات ذات مغزى. على سبيل المثال، قد تصف خطابات المرجعية المرشحين الذكور والإناث بشكل مختلف، أو قد تكشف أسلوب الكتابة الخاصة بهم بشكل غير مباشر عن الخصائص الديموغرافية. في أحسن الأحوال، يصرف مثل هذه التحيزات عن المحتوى المجدي للنص؛ في أسوأ الأحوال يمكن أن تؤدي إلى نتائج غير عادلة. نحن نبحث في تحدي إعادة توليد جمل مدخلات لتحييد "السمات الحساسة" مع الحفاظ على المعنى الدلالي للنص الأصلي (E.G. هو المرشح المؤهل؟). نقترح إطار إعادة كتابة واستنادا في التدرج، والكشف عن وإقلاده لتحييد (DEPEN)، الذي يكتشف أولا مكونات حساسة ويخفيهن من أجل التجديد، ثم يزعج نموذج الجيل عند فك تشفير الوقت تحت قيد تحييد يدفع التوزيع (المتوقع) سمات نحو توزيع موحد. تظهر تجاربنا في سيناريوهات مختلفة أن DEPEN يمكن أن تجدد البدائل الطوفية محايدة في السمة الحساسة مع الحفاظ على دلالات السمات الأخرى.
Written language carries explicit and implicit biases that can distract from meaningful signals. For example, letters of reference may describe male and female candidates differently, or their writing style may indirectly reveal demographic characteristics. At best, such biases distract from the meaningful content of the text; at worst they can lead to unfair outcomes. We investigate the challenge of re-generating input sentences to neutralize' sensitive attributes while maintaining the semantic meaning of the original text (e.g. is the candidate qualified?). We propose a gradient-based rewriting framework, Detect and Perturb to Neutralize (DEPEN), that first detects sensitive components and masks them for regeneration, then perturbs the generation model at decoding time under a neutralizing constraint that pushes the (predicted) distribution of sensitive attributes towards a uniform distribution. Our experiments in two different scenarios show that DEPEN can regenerate fluent alternatives that are neutral in the sensitive attribute while maintaining the semantics of other attributes.
References used
https://aclanthology.org/
We propose the first general-purpose gradient-based adversarial attack against transformer models. Instead of searching for a single adversarial example, we search for a distribution of adversarial examples parameterized by a continuous-valued matrix
Query rewrite (QR) is an emerging component in conversational AI systems, reducing user defect. User defect is caused by various reasons, such as errors in the spoken dialogue system, users' slips of the tongue or their abridged language. Many of the
The dominant paradigm for semantic parsing in recent years is to formulate parsing as a sequence-to-sequence task, generating predictions with auto-regressive sequence decoders. In this work, we explore an alternative paradigm. We formulate semantic
We introduce a new dataset for Question Rewriting in Conversational Context (QReCC), which contains 14K conversations with 80K question-answer pairs. The task in QReCC is to find answers to conversational questions within a collection of 10M web page
Scheduled sampling is widely used to mitigate the exposure bias problem for neural machine translation. Its core motivation is to simulate the inference scene during training by replacing ground-truth tokens with predicted tokens, thus bridging the g