ترغب بنشر مسار تعليمي؟ اضغط هنا

إن استكشاف جوانب المعنى السورية الضمني أو غير المحدود في السياق مهم لفهم الجملة.في هذه الورقة، نقترح هندسة رواية قائمة على الإحلال في اكتشاف متطلبات المراجعة.الهدف هو تحسين التفاهم، معالجتها بعض الأنواع من المراجعات، خاصة بالنسبة لنوع الضمير المستبدل .نظرا لأن نظامنا القائم على الأسطلات يمكن أن يتوقع الضمائر محلها جيدا على مستوى الإشارة.ومع ذلك، فإن نظامنا المشترك على مستوى الجملة لا يتحسن في خط الأساس بيرت على مستوى الجملة.نقدم أيضا أنظمة تناقض إضافية، وإظهار النتائج لكل نوع من التحرير.
تستخدم Word Embeddings على نطاق واسع في معالجة اللغة الطبيعية (NLP) لمجموعة واسعة من التطبيقات. ومع ذلك، فقد ثبت باستمرار أن هذه المدينات تعكس نفس التحيزات البشرية الموجودة في البيانات المستخدمة لتدريبها. معظم مؤشرات التحيز المنصوص عليها للكشف عن تحي ز Word Embeddings مؤشرات قائمة على أساس مقياس التشابه الجيبلي. في هذه الدراسة، ندرس آثار تدابير التشابه المختلفة وكذلك التقنيات الوصفية الأخرى أكثر من المتوسط ​​في قياس تحيزات تضمين الكلمات السياقية وغير السياقية. نظهر أن حجم التحيزات المكشوفة في Word Embeddings يعتمد على تدابير الإحصاءات الوصفية والتشابه المستخدمة لقياس التحيز. وجدنا أنه خلال الفئات العشرة من اختبارات جمعية تضمين Word، تكشف مسافة Mahalanobis عن أصغر التحيز، وتكشف مسافة Euclidean عن أكبر تحيز في Word Ageddings. بالإضافة إلى ذلك، تكشف النماذج السياقية عن تحيزات أقل حدة من نماذج تضمين الكلمة غير السياقية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا