ترغب بنشر مسار تعليمي؟ اضغط هنا

تأثير Covid-19 في منشورات معالجة اللغة الطبيعية: دراسة مصنفة في النوع الاجتماعي والمساهمة والخبرات

Impact of COVID-19 in Natural Language Processing Publications: a Disaggregated Study in Gender, Contribution and Experience

53   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يلقي هذه الدراسة الضوء على آثار Covid-19 في مجال معين من اللغويات الحاسوبية ومعالجة اللغات الطبيعية داخل الذكاء الاصطناعي.نحن نقدم دراسة مقطعية بشأن النوع الاجتماعي والمساهمة والخبرة التي تعتبر سنة دراسية واحدة (من أغسطس 2019 إلى 20 أغسطس) كعاموبئ في الوباء.يتم تضمين أغسطس مرتين لغرض مقارنة بين السنوية.في حين ارتفع الاتجاه في المنشورات مع الأزمة، فإن النتائج تظهر أن النسبة بين المنشورات النسائية والذكور انخفضت.هذا يساعد فقط على تقليل أهمية دور الإناث في المساهمات العلمية لللغويات الحاسوبية (أصبح الآن أقل بكثير من ذروة 0.24).يحتوي الوباء على تأثير سلبي بشكل خاص على إنتاج كبار الباحثات في المركز الأول للمؤلفين (أقصى عمل)، تليها الباحثون الصغار الإناث في المركز الأخير من المؤلفين (الإشراف أو العمل التعاوني).

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعد أنظمة معالجة اللغة الطبيعية (NLP) في قلب العديد من أنظمة صنع القرار الآلي الحرجة التي تجعل توصيات حاسمة حول عالمنا في المستقبل.تم دراسة التحيز بين الجنسين في NLP جيدا باللغة الإنجليزية، لكنها كانت أقل دراستها بلغات أخرى.في هذه الورقة، تضم فريقا ب ينهم متحدثون 9 لغات - الصينية والإسبانية والإنجليزية والعربية والألمانية والفرنسية والفرصي والأوردو وولف - تقارير وتحليل قياسات التحيز بين الجنسين في ولاية ويكيبيديا كورسيا لهذه اللغات 9 لغات 9 لغات 9 لغات 9 لغات 9 لغات هذه.نقوم بتطوير ملحقات لحسابات متر راي حساسية على مستوى المهنة والجنس على مستوى كوربوس المصممة في الأصل للغة الإنجليزية وتطبيقها على 8 لغات أخرى، بما في ذلك اللغات التي لديها أسماء جنسانية من النوع الاجتماعي بما في ذلك كلمات المهنة الأنثوية والمذكر والمحايدة المختلفة.نناقش العمل في المستقبل من شأنه أن يستفيد بشكل كبير من منظور اللغويات الحاسوبية.
يوفر تقطير المعرفة (KD) وسيلة طبيعية لتقليل الكمون واستخدام الذاكرة / الطاقة للنماذج المسبقة للأعياد الضخمة التي تأتي للسيطرة على معالجة اللغة الطبيعية (NLP) في السنوات الأخيرة. في حين أن العديد من المتغيرات المتطورة في خوارزميات KD قد اقترحت لتطبيقا ت NLP، فإن العوامل الرئيسية التي تدعم أداء التقطير الأمثل غالبا ما تكون مرتبكة وتبقى غير واضحة. نحن نهدف إلى تحديد مدى تأثير مكونات مختلفة في خط أنابيب KD على الأداء الناتج ومقدار خط أنابيب KD الأمثل يختلف عبر مجموعات البيانات / المهام المختلفة، مثل سياسة تكبير البيانات، وظيفة الخسارة، والتمثيل الوسيط لنقل المعرفة بين المعلم وطالب. لتتأكد من أن آثارها، نقترح تقطير، إطار التقطير، يجمع بشكل منهجي بين مجموعة واسعة من التقنيات عبر مراحل مختلفة من خط أنابيب KD، مما يتيح لنا تحديد مساهمة كل مكون. ضمن تقطير، ونحن نقوم بتحديد الأهداف الشائعة الاستخدام لتقطير التمثيلات الوسيطة بموجب هدف معلومات متبادلة عالمية (MI) واقتراح فئة من الوظائف الموضوعية MI مع التحيز / تباين التباين أفضل لتقدير ميل بين المعلم والطالب. في مجموعة متنوعة من مجموعات بيانات NLP، يتم تحديد أفضل تكوينات تقطير عبر تحسين المعلمة على نطاق واسع. تجاربنا تكشف عن ما يلي: 1) النهج المستخدم لتقطير التمثيل الوسيط هو أهم عامل في أداء الدكتوراط، 2) بين أهداف مختلفة للتقطير الوسيط، MI-تنفذ أفضل، و 3) يوفر تكبير البيانات دفعة كبيرة ل مجموعات البيانات التدريب الصغيرة أو شبكات الطلاب الصغيرة. علاوة على ذلك، نجد أن مجموعات البيانات / المهام المختلفة تفضل خوارزميات KD المختلفة، وبالتالي اقترح خوارزمية بسيطة ل Autodistiller التي يمكن أن توصي بخط أنابيب KD جيدة لمجموعة بيانات جديدة.
تشير الدراسات الحديثة إلى أن العديد من أنظمة NLP حساسة وعرضة للاضطرابات الصغيرة للمدخلات ولا تعميمها بشكل جيد عبر مجموعات البيانات المختلفة. هذا الافتقار إلى المتانة ينطبق على استخدام أنظمة NLP في تطبيقات العالم الحقيقي. يهدف هذا البرنامج التعليمي إل ى زيادة الوعي بالشواغل العملية حول متانة NLP. يستهدف الباحثون والممارسون الخماسيون الذين يهتمون ببناء أنظمة NLP موثوقة. على وجه الخصوص، سنراجع الدراسات الحديثة حول تحليل ضعف أنظمة NLP عند مواجهة المدخلات والبيانات المعديين مع تحول التوزيع. سوف نقدم للجمهور بهدف شامل من 1) كيفية استخدام أمثلة الخصومة لفحص ضعف نماذج NLP وتسهيل تصحيح الأخطاء؛ 2) كيفية تعزيز متانة نماذج NLP الحالية والدفاع ضد المدخلات الخصومة؛ 3) كيف يؤثر النظر في المتانة على تطبيقات NLP العالمية الحقيقية المستخدمة في حياتنا اليومية. سنختتم البرنامج التعليمي عن طريق تحديد اتجاهات البحث في المستقبل في هذا المجال.
في هذه الورقة، نقترح تعريف وتعريفي من أنواع مختلفة من المحتوى النصي غير القياسي - يشار إليها عموما باسم الضوضاء "- في معالجة اللغة الطبيعية (NLP). في حين أن معالجة البيانات المسبقة هي بلا شك مهم بلا شك في NLP، خاصة عند التعامل مع المحتوى الذي تم إنشا ؤه من قبل المستخدم، فإن فهم أوسع لمصادر الضوضاء المختلفة وكيفية التعامل معها هو جانب تم إهماله إلى حد كبير. نحن نقدم قائمة شاملة للمصادر المحتملة للضوضاء، وتصنيفها ووصفها، وتظهر تأثير مجموعة فرعية من استراتيجيات المعالجة القياسية المعدلة على مهام مختلفة. هدفنا الرئيسي هو زيادة الوعي بالمحتوى غير المعتاد - والذي لا ينبغي اعتباره دائما ضوضاء "- والحاجة إلى المعالجة المسبقة التي تعتمد على المهام. هذا بديل إلى بطانية، مثل الحلول الشاملة التي تطبقها الباحثون بشكل عام من خلال "خطوط أنابيب معالجة مسبقا مسبقا". النية هي لهذا التصنيف بمثابة نقطة مرجعية لدعم الباحثين NLP في وضع الاستراتيجيات لتنظيف أو تطبيع أو احتضان المحتوى غير المعتاد.
في المنتديات عبر الإنترنت تركز على الصحة والرفاهية، يميل الأفراد إلى البحث عن الدعم الاجتماعي التالي وإعطاء الدعم العاطفي والإعلام. فهم تعبيرات هذه الدعم الاجتماعي في منتدى Covid - 19 عبر الإنترنت أمر مهم من أجل: (أ) المنتدى وأعضائه لتوفير النوع الصح يح من الدعم للأفراد و (ب) تحديد الآثار الطويلة الأجل لوباء Covid-19 على رفاه الجمهور، وبالتالي إبلاغ التدخلات. في هذا العمل، نبني أربع نماذج لتعليم الآلات لقياس مدى الدعم الاجتماعي التالي المعبر عنها في كل منشور في منتدى Covid-19 عبر الإنترنت: (أ) الدعم العاطفي المعطى (ب) سعى الدعم العاطفي (ج) الدعم المعلوماتي المعطى، و (د) سعى الدعم المعلوماتي. باستخدام هذه النماذج، نهدف إلى: (1) تحديد ما إذا كان هناك ارتباط بين الدعم الاجتماعي المختلفة المعبر عنه في مشاركات E.G. عندما يقدم أعضاء المنتدى الدعم العاطفي في الوظائف، هل يميلون أيضا إلى إعطاء أو طلب دعم إعلامي في نفس المنصب؟ (2) تحديد كيفية طلب هذه الدعم الاجتماعي والتغيرات مع مرور الوقت في الوظائف المنشورة. نجد أن (ط) هناك ارتباط إيجابي بين الدعم المعلوماتي الوارد في الوظائف والدعم العاطفي المعطى والدعم العاطفي المطلوب، على التوالي، في هذه الوظائف و (2) مع مرور الوقت، تميل المستخدمين إلى البحث عن المزيد من الدعم العاطفي وإعطاء أقل الدعم العاطفي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا