ترغب بنشر مسار تعليمي؟ اضغط هنا

فحص البساطة بين الجنسين السرية: دراسة حالة في نماذج الترجمة التركية والإنجليزية

Examining Covert Gender Bias: A Case Study in Turkish and English Machine Translation Models

168   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نظرا لأن الترجمة الآلية (MT) أصبحت أكثر قوة بشكل متزايد، والتي يمكن الوصول إليها، واستفادتها، فقد نمت إمكانات إدامة التحيز إلى جانب تقدمها.في حين تمت دراسة المؤشرات العلنية للحيز في الترجمة الآلية، فإننا نجادل بأن التحيزات السرية تعرض مشكلة ترسيخها.من خلال استخدام اللغة المحايدة بين الجنسين اللغة التركية واللغة الجنسية الإنجليزية، ندرس حالات التحيز بين الجنسين العلني والسرية في نماذج MT.على وجه التحديد، نقدم طريقة للتحقيق في العلامات الجنسانية غير المتماثلة.نقوم أيضا بتقييم التحيز في إسناد الشخصية وفحص الصور النمطية المهنية والشخصية من خلال مؤشرات التحيز العلنية في طرازات MT.يستكشف عملنا طبقة أعمق من التحيز في طرازات MT ويوضح الحاجة المستمرة لمنهجية متعددة التخصصات اللغوية في تطوير نموذج MT.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

مع نشر نماذج اللغة بشكل متزايد في العالم الحقيقي، من الضروري معالجة مسألة نزاهة مخرجاتها. غالبا ما تعتمد كلمة تضمين تمثيلات نماذج اللغة هذه ضمنيا ارتباطات غير مرغوب فيها تشكل تحيزا اجتماعيا داخل النموذج. تطرح طبيعة اللغات بين الجنسين مثل الهندية مشكل ة إضافية في تقدير التحيز والتخفيف من التحيز، بسبب التغيير في شكل الكلمات في الجملة، بناء على جنس الموضوع. بالإضافة إلى ذلك، هناك أعمال متناثرة تتم في مجال أنظمة القياس والدولي لغات Instan. في عملنا، نحاول تقييم وتحديد التحيز بين الجنسين داخل نظام الترجمة الآلية الهندية-الإنجليزية. نقوم بتنفيذ إصدار تعديل من متري TGBI الموجود على أساس الاعتبارات النحوية له الهندية. قارننا أيضا وتتناقض مع قياسات التحيز الناتجة عن مقاييس متعددة للمظلات المدربة مسبقا وتلك التي تعلمتها نموذج الترجمة الآلي لدينا.
سهلت تقنية التكنولوجيا (MT) عن مهامنا اليومية من خلال توفير اختصارات يمكن الوصول إليها لجمع المعلومات والمعالجة والتواصل.ومع ذلك، يمكن أن تعاني من التحيزات التي تضر المستخدمين والمجتمع ككل.كحافظ جديد نسبيا للاستفسار، لا تزال دراسات التحيز بين الجنسين في MT تفتقر إلى التماسك.هذا المدافع عن إطار موحد لتخفيف البحوث المستقبلية.تحقيقا لهذه الغاية، نحن: 1) مراجعة النظرة بشكل خطير المفاهيم الحالية للتحيز في ضوء الأفكار النظرية من التخصصات ذات الصلة، 2) تلخص التحليلات السابقة التي تهدف إلى تقييم التحيز بين الجنسين في MT، III) مناقشة استراتيجيات التخفيف المقترحة حتى الآن، والرابع)نحو الاتجاهات المحتملة للعمل في المستقبل.
في هذه الورقة ونحن نستكشف تقنيات مختلفة للتغلب على تحديات الموارد المنخفضة في الترجمة الآلية العصبية (NMT) وتركز على وجه التحديد على حالة اللغة الإنجليزية الماراثية NMT. تتطلب أنظمة NMT كمية كبيرة من كورسا الموازية للحصول على ترجمات ذات نوعية جيدة. ن حاول تخفيف مشكلة الموارد المنخفضة عن طريق زيادة Corpora الموازية أو باستخدام تعلم النقل. تستخدم تقنيات مثل حقن الجدول العبارة (PTI) والترجمة الخلفي وخلط لغة اللغة لتعزيز البيانات الموازية؛ في حين أن المظلات المحورية والمحسبات متعددة اللغات تستخدم للاستفادة من تعلم التحويل. بالنسبة للمحور المحوري، تأتي الهندية في اللغة المساعدة للترجمة الإنجليزية المهاراتية. بالمقارنة مع نموذج محول الأساس، يلاحظ اتجاه تحسن كبير في درجة بلو عبر تقنيات مختلفة. لقد قمنا بإجراء تقييم واسع النطاق والتولي والنوعي لأنظمنا. نظرا لأن الاتجاه في الترجمة الآلية (MT) اليوم هو ما بعد التحرير وقياس الحد من الجهود البشرية (لها)، ونعطينا ملاحظاتنا الأولية لمعدل تحرير الترجمة (TER) مقابل دراسة درجة بلو وحيث يعتبر TER كتدبير لها.
التحيز بين الجنسين في Adgeddings تصبح تدريجيا حقل بحثي حية في السنوات الأخيرة.تهدف معظم الدراسات في هذا المجال إلى أساليب القياس والدولي مع اللغة الإنجليزية كلغة الهدف.تحقق هذه الورقة في التحيز بين الجنسين في تضيير كلمة ثابتة من منظور فريد من منظور ص يني.من خلال التدريب على تمثيلات الكلمات مع نماذج مختلفة، يتم تقييم التحيز بين الجنسين وراء ناقلات الصفات.من خلال مقارنة بين النتائج المنتجة ومجموعة بيانات مسجلة بشرية، نوضح كيف يميز التحيز بين الجنسين المشفرة في AdmBeddings من مواقف الناس.
في هذا العمل، نستكشف تأثير دمج البيانات الوصفية الديموغرافية في نصوص نصية مدربة على رأس نموذج لغة محول مدرب مسبقا. وبشكل أكثر تحديدا، نضيف معلومات حول جنس النقاد ومؤلفي الكتاب عند تصنيف قطبية مراجعات الكتب، وقطبية الاستعراضات عند تصنيف الجنسين من الم ؤلفين والنقاد. نحن نستخدم مجموعة بيانات موجودة من مراجعات الكتاب النرويجية من خلال تقييمات من قبل النقاد المحترفين، والتي عززت أيضا مع المعلومات الجنسانية، وتدريب مصنف معنويات على مستوى المستند أعلى نموذج برت النرويجي الذي تم إصداره مؤخرا. نظهر أن النماذج المستنيرة بين الجنسين تحصل على دقة أعلى إلى حد كبير، وأن النماذج المستنيرة بالقطبية تحصل على دقة أعلى عند تصنيف جندات مؤلفي الكتاب. بالنسبة إلى مجموعة البيانات الخاصة بهذه الطريقة، نأخذ هذه النتيجة تأكيدا بتحيز بين الجنسين في توزيع الملصقات الأساسية، ولكن في أوائل أخرى نعتقد أنه يمكن استخدام نهج مماثل لتخفيف التحيز في النموذج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا