ترغب بنشر مسار تعليمي؟ اضغط هنا

رسم الخرائط من معالجة اللغات الطبيعية للخير الاجتماعي (NLP4SG): البحث عن التعريفات والإحصائيات والبقع البيضاء

Cartography of Natural Language Processing for Social Good (NLP4SG): Searching for Definitions, Statistics and White Spots

550   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نطاق الأعمال التي يمكن اعتبارها نظامية NLP للاجتماع الاجتماعي (NLP4SG) هائلة. في حين أن الكثير منهم يستهدفون تحديد خطاب الكراهية أو الأخبار المزيفة، فهناك آخرون هذا العنوان، على سبيل المثال، تبسيط النص لتخفيف عواقب عسر القراءة، أو التدريب على استراتيجيات مكافحة الاكتئاب. ومع ذلك، حتى الآن، لا توجد صورة واضحة عن المناطق التي تستهدفها NLP4SG، وهي الجهات الفاعلة، وهي السيناريوهات الرئيسية وما هي الموضوعات التي تم تركها جانبا. من أجل الحصول على وجهة نظر أوضح في هذا الصدد، نقترح أولا تعريف عمل ل NLP4SG وتحديد بعض الجوانب الأولية التي هي حاسمة بالنسبة ل NLP4SG، بما في ذلك، على سبيل المثال، المناطق والأخلاق والخصوصية والتحيز. بعد ذلك، نسربنا على جثة تبلغ حوالي 50000 مادة تم تنزيلها من مختارات ACL. استنادا إلى قائمة الكلمات الرئيسية التي تم استرجاعها من الأدبيات المنقحة في ضوء المهمة، نختار من هذه المقالات التي يمكن اعتبارها في NLP4SG وفقا لتعريفنا وتحليلها من حيث الاتجاهات على طول الخط الزمني، إلخ. والنتيجة هي خريطة لأبحاث وأفكار NLP4SG الحالية بشأن البقع البيضاء على هذه الخريطة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

النقاش حول تغير المناخ (CC) - - مدى أسبابه، والاستجابات اللازمة - - مكثفة وعدم أهمية عالمية. ومع ذلك، في مجتمع معالجة اللغة الطبيعي (NLP)، استقبل هذا المجال حتى الآن الكثير من الاهتمام. على النقيض من ذلك، فهي بارزة هائلة في مختلف التخصصات العلوم الاج تماعية، وبعض هذا العمل يتبع نموذج "نص البيانات"، والسعي إلى استخدام الأساليب الكمية لتحليل كميات كبيرة من النص المرتبط بمكبر الصوت. البحث الآخر هو نوعية في الطبيعة والدراسات تفاصيل، الفروق الدقيقة والجهات الفاعلة والدوافع داخل خطابات CC. من الناحية القادمة من كل من NLP والعلوم السياسية، ومراجعة الأعمال الرئيسية في كلا التخصصات، نناقش كيف يمكن لنقل العلوم الاجتماعية لمناقشات CC تقديم التقدم في التعدين / NLP، وكيفية، في المقابل، يمكن ل NLP دعم صانعي السياسات والناشطين في من الفائدة من خطابات CC واسعة النطاق ومعقدة عبر الأنواع المختلفة والقنوات والموضوعات والمجتمعات. هذا أمر بالغ الأهمية لقدرته على جعل تأثير سريع وذات مغزى على الخطاب، وتشكيل تغيير السياسة اللازمة.
3737 - MIT press 1999 كتاب
أصبحت الأساليب الإحصائية لمعالجة اللغات الطبيعية مهيمنة في السنوات الأخيرة. يوفر هذا الكتاب تغطية واسعة وعميقة للأسس الرياضية واللغوية لهذه الطرائق، بالإضافة إلى ذلك, يزوّد الكتاب شرح مفصل للأساليب الإحصائية ، مما يسمح للطلاب والباحثين ببناء تطبيقاتهم الخاصة.
تجمع أبحاث معالجة اللغة الطبيعية (NLP) بين دراسة المبادئ العالمية، من خلال العلوم الأساسية، مع استهداف العلوم التطبيقية في حالات الاستخدام وإعدادات محددة. ومع ذلك، غالبا ما يفترض عملية التبادل بين NLP والتطبيقات الأساسية في كثير من الأحيان الظهور بشك ل طبيعي، مما أدى إلى العديد من الابتكارات التي تسير دون مبرر والعديد من الأسئلة المهمة تركت غير مستعصة. نحن نصف نموذج جديد من Translationations NLP، الذي يهدف إلى بنية وتيسير العمليات التي تبلغ بها بحث NLP الأساسي والتطبيقي بعضها البعض. وبالتالي يعرض NLP نموذجا للبحث الثالث، ركز على فهم التحديات التي تطرحها احتياجات التطبيق وكيف يمكن أن تدفع هذه التحديات الابتكار في تصميم العلوم والتكنولوجيا الأساسية. نظرا لأن العديد من التطورات المهمة في أبحاث NLP قد برزت من تقاطع المبادئ الأساسية مع احتياجات الطلب، وتقديم إطار مفاهيمي يحدد أصحاب المصلحة والأسئلة الرئيسية في البحوث المتعلقة بالجمالية. يوفر إطار عملنا خريطة طريق لتطوير Translationations NLP كجال بحث مخصص، وتحدد المبادئ التعليمية العامة لتسهيل التبادل بين البحوث الأساسية والتطبيقية.
نقترح نقدي علامتي التعلم النشط (CAL)، وهي خوارزمية للتعلم النشطة الجديدة (AL) التي تستغل سلوك النموذج على الحالات الفردية أثناء التدريب كوكيل للعثور على أكثر الحالات إعلامية لوضع العلامات.يستقبل Cal بواسطة خرائط البيانات، التي اقترحت مؤخرا أن تستمد ا لأفكار في جودة البيانات (Swayamdipta et al.، 2020).قارنا طريقنا على مهام تصنيف النص الشعبي لاستراتيجيات آل شائعة، والتي تعتمد بدلا من ذلك على سلوك ما بعد التدريب.نوضح أن CAL منافسة أساليب المنطقية المشتركة الأخرى، مما يدل على أن الديناميات التدريبية المستمدة من بيانات البذور الصغيرة يمكن استخدامها بنجاح في آل.نحن نقدم رؤى في طريقتنا الجديدة من خلال تحليل إحصاءات المستوى الدفاعية باستخدام خرائط البيانات.تبين نتائجنا كذلك أن Cal ينتج عنه استراتيجية تعليمية أكثر كفاءة في البيانات، وتحقيق نتائج قابلة للمقارنة أو أفضل مع بيانات تدريب أقل بكثير.
تصف هذه الورقة إدخال مجموعة الأبحاث سيناء في مهمة SMM4H الرئيسية على تحديد المهن والمهن في وسائل التواصل الاجتماعي ذات الصلة بالصحة.على وجه التحديد، شاركنا في المهمة 7A: Tweet تصنيف ثنائي لتحديد ما إذا كانت تغريدة تحتوي على تذوق من المهن أم لا، وكذلك في المهمة 7 ب: كشف إزاحة وتصنيف NER الذي يهدف إلى تذكر المهن وتصنيفها عن التمييز بين المهن وحضال العمل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا