التحيز منتشر لنماذج NLP، تحفز تطوير تقنيات الدخل التلقائي.يقتصر تقييم أساليب ديوان NLP إلى حد كبير على السمات الثنائية في العزلة، على سبيل المثال، الدخان فيما يتعلق بالجنس أو العرق الثنائي، إلا أن العديد من الشركات تشمل العديد من هذه الصفات، وربما مع ارتفاع كرادة.في هذه الورقة، نقول أن نموذجا عادلا حقيقيا يجب أن يفكر في مجموعات GerryMandering التي تضم سمات مفردة فحسب، بل أيضا مجموعات تقاطع أيضا.نحن نقيم شكل من أشكال النموذج المحيزي الجديد الذي هو جديد على NLP، وكذلك امتداد تقنية الإسقاط Nullspace التكراري يمكن أن تتعامل مع هويات متعددة.
Bias is pervasive for NLP models, motivating the development of automatic debiasing techniques. Evaluation of NLP debiasing methods has largely been limited to binary attributes in isolation, e.g., debiasing with respect to binary gender or race, however many corpora involve multiple such attributes, possibly with higher cardinality. In this paper we argue that a truly fair model must consider gerrymandering' groups which comprise not only single attributes, but also intersectional groups. We evaluate a form of bias-constrained model which is new to NLP, as well an extension of the iterative nullspace projection technique which can handle multiple identities.
References used
https://aclanthology.org/
خلال العقد الأخير من القرن العشرين ظهرت مجموعة من المتغيرات التكنولوجية المتقدمة في مجالات نظم المعلومات المرتبطة بالحاسبات الآلية و وسائل الاتصال و ضغط البيانات و نقلها عبر شبكات الحاسب الآلي. حيث انتقلت نظم المعلومات من اعتمادها على النص و بعض الرس
The aim of this research is to evaluate the rights of taxpayers in the Syrian tax legislation, especially the Income Tax Law No. (24) for the year 2003 and its amendments, and related laws. The evaluation process includes the availability of these ri
Sentence weighting is a simple and powerful domain adaptation technique. We carry out domain classification for computing sentence weights with 1) language model cross entropy difference 2) a convolutional neural network 3) a Recursive Neural Tensor
Multimodal Neural Machine Translation (MNMT) is an interesting task in natural language processing (NLP) where we use visual modalities along with a source sentence to aid the source to target translation process. Recently, there has been a lot of wo
The word "massive data" spread in 2017 and became the most common in the industry of advanced technology, it uses automated learning that allows computers to analyze past data and predict future data widely in familiar places. Non-automated learning