ترغب بنشر مسار تعليمي؟ اضغط هنا

أضرار الحصرية والتحديات الجنسانية في التمثيل غير الثنائي في تكنولوجيات اللغة

Harms of Gender Exclusivity and Challenges in Non-Binary Representation in Language Technologies

108   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يناقش الجنس على نطاق واسع في سياق المهام اللغوية وعند فحص الصور النمطية الناتجة عن نماذج اللغة.ومع ذلك، تعامل المناقشات الحالية في المقام الأول بين الجنسين باعتبارها ثنائية، والتي يمكن أن تديم الأضرار مثل المحور الدوري للهويات الجنسية غير الثنائية.هذه الأضرار مدفوعة بالتحيزات النموذجية ومجموعات البيانات، والتي هي عواقب عدم الاعتراف بعدم الاعتراف بعدم الاعتراف بعدم الاعتراف بالعقاب غير الثنائية في المجتمع.في هذه الورقة، نوضح تعقيد الجنس واللغة حولها، ومسح الأشخاص غير الثنائيين لفهم الأضرار المرتبطة بمعاملة الجنس باعتبارها ثنائية في تكنولوجيات اللغة الإنجليزية.كما نقوم بالتفصيل كيف تمثيل اللغات الحالية (على سبيل المثال، قفاز، بيرت)، وإدامة هؤلاء الأضرار والتحديات ذات الصلة التي يجب الاعتراف بها ومعالجتها للتمثيلات بتشفير المعلومات الجنسانية بشكل قاطع.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح أن نقترح Captioner أخبار البصرية، وهو نموذج كيائن كيائن لمهمة تقسيم صورة الأخبار. نقدم أيضا Visual News، وهو معيار واسع النطاق يتكون من أكثر من مليون صورة إخبارية إلى جانب المقالات الإخبارية المرتبطة، وتستياؤ الصور، ومعلومات المؤلف، والبيانات ا لوصفية الأخرى. على عكس مهمة تقسيم الصور القياسية، تصور الصور الأخبار المواقف التي يكون فيها الأشخاص والمواقع والأحداث ذات أهمية قصوى. يمكن أن تجمع طريقةنا المقترحة بشكل فعال بين الميزات المرئية والنصية لتوليد التسميات التوضيحية مع معلومات أكثر ثراء مثل الأحداث والكيانات. وبشكل أكثر تحديدا، تم تصميمها على بنية المحولات، يتم تزويد نموذجنا بمزيد من المجهز بتقنيات الانصهار متعددة الوسائط على الرواية وآليات الاهتمام، والتي تم تصميمها لتوليد كيانات اسمه أكثر دقة. تستخدم طريقتنا معلمات أقل بكثير مع تحقيق نتائج تنبؤ أفضل قليلا من الأساليب المنافسة. توضح مجموعة بيانات الأخبار المرئية الأكبر والأكثر تنوعا التحديات المتبقية في تصوير الصور الإخبارية.
في هذه الورقة نسأل عن تأثير التمثيل الجنساني في البيانات التدريبية على أداء نظام ASR المنتهي للنهاية.نقوم بإنشاء تجربة بناء على Corpus Librispeech و Build 3 تدريبات تدريبية مختلفة تختلف فقط نسبة البيانات التي تنتجها كل فئة جنسانية.نلاحظ أنه إذا كان ن ظامنا قوي بشكل عام على التوازن بين الجنسين أو عدم التوازن في البيانات التدريبية، إلا أنه يعتمد على الكفاية بين الأفراد الموجودين في مجموعات التدريب والاختبار.
تعد أنظمة معالجة اللغة الطبيعية (NLP) في قلب العديد من أنظمة صنع القرار الآلي الحرجة التي تجعل توصيات حاسمة حول عالمنا في المستقبل.تم دراسة التحيز بين الجنسين في NLP جيدا باللغة الإنجليزية، لكنها كانت أقل دراستها بلغات أخرى.في هذه الورقة، تضم فريقا ب ينهم متحدثون 9 لغات - الصينية والإسبانية والإنجليزية والعربية والألمانية والفرنسية والفرصي والأوردو وولف - تقارير وتحليل قياسات التحيز بين الجنسين في ولاية ويكيبيديا كورسيا لهذه اللغات 9 لغات 9 لغات 9 لغات 9 لغات 9 لغات هذه.نقوم بتطوير ملحقات لحسابات متر راي حساسية على مستوى المهنة والجنس على مستوى كوربوس المصممة في الأصل للغة الإنجليزية وتطبيقها على 8 لغات أخرى، بما في ذلك اللغات التي لديها أسماء جنسانية من النوع الاجتماعي بما في ذلك كلمات المهنة الأنثوية والمذكر والمحايدة المختلفة.نناقش العمل في المستقبل من شأنه أن يستفيد بشكل كبير من منظور اللغويات الحاسوبية.
تقدم هذه الورقة أدوات ومصادر البيانات التي تم جمعها وأصدرها مشروع Embeddia، بدعم من برنامج الأفق والابتكار في الأفق والابتكار في الاتحاد الأوروبي.تم تقديم الموارد التي تم جمعها للمشاركين في مجموعة متنظمة تنظيم كجزء من Hackashop EACL حول تحليل محتوى و سائل الإعلام وأجيال التقرير الآلي في فبراير 2021. كان لدى هايتاثون ست فرق مشاركة معالجتها التحديات المختلفة، إما من قائمة التحديات المقترحة أو بهمالمهام المتعلقة بالأخبار والصناعة.تتجاوز هذه الورقة نطاق المهارة، حيث إنها تجمع في شكل متماسك ومدمج معظم الموارد المتقدمة، التي تم جمعها وإصدارها من قبل مشروع Embeddia.علاوة على ذلك، فإنه يشكل مصدرا مفيدا لصناعة الإعلام والباحثين في مجالات معالجة اللغة الطبيعية والعلوم الاجتماعية.
باستخدام شكل النمذجة ومشابه الكلمة القائمة على المعجم، نجد أن القصص الناتجة عن GPT-3 تظهر العديد من الصور النمطية الجنسانية المعروفة.قصص تم إنشاؤها تصور مواضيع وأوصاف مختلفة اعتمادا على الجنس المتصور GPT-3 من الشخصية في موجه، مع أحرف أنثوية أكثر عرضة للأسرة والمظهر، ووصف بأنه أقل قوة من أحرف الذكورية، حتى عند الاقتراح بأفعال عالية الطاقةفي موجه.تجمع دراستنا أسئلة حول كيف يمكن للمرء تجنب التحيزات الاجتماعية غير المقصودة عند استخدام نماذج لغة كبيرة لرواية القصص.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا