نطاق الأعمال التي يمكن اعتبارها نظامية NLP للاجتماع الاجتماعي (NLP4SG) هائلة. في حين أن الكثير منهم يستهدفون تحديد خطاب الكراهية أو الأخبار المزيفة، فهناك آخرون هذا العنوان، على سبيل المثال، تبسيط النص لتخفيف عواقب عسر القراءة، أو التدريب على استراتيجيات مكافحة الاكتئاب. ومع ذلك، حتى الآن، لا توجد صورة واضحة عن المناطق التي تستهدفها NLP4SG، وهي الجهات الفاعلة، وهي السيناريوهات الرئيسية وما هي الموضوعات التي تم تركها جانبا. من أجل الحصول على وجهة نظر أوضح في هذا الصدد، نقترح أولا تعريف عمل ل NLP4SG وتحديد بعض الجوانب الأولية التي هي حاسمة بالنسبة ل NLP4SG، بما في ذلك، على سبيل المثال، المناطق والأخلاق والخصوصية والتحيز. بعد ذلك، نسربنا على جثة تبلغ حوالي 50000 مادة تم تنزيلها من مختارات ACL. استنادا إلى قائمة الكلمات الرئيسية التي تم استرجاعها من الأدبيات المنقحة في ضوء المهمة، نختار من هذه المقالات التي يمكن اعتبارها في NLP4SG وفقا لتعريفنا وتحليلها من حيث الاتجاهات على طول الخط الزمني، إلخ. والنتيجة هي خريطة لأبحاث وأفكار NLP4SG الحالية بشأن البقع البيضاء على هذه الخريطة.
The range of works that can be considered as developing NLP for social good (NLP4SG) is enormous. While many of them target the identification of hate speech or fake news, there are others that address, e.g., text simplification to alleviate consequences of dyslexia, or coaching strategies to fight depression. However, so far, there is no clear picture of what areas are targeted by NLP4SG, who are the actors, which are the main scenarios and what are the topics that have been left aside. In order to obtain a clearer view in this respect, we first propose a working definition of NLP4SG and identify some primary aspects that are crucial for NLP4SG, including, e.g., areas, ethics, privacy and bias. Then, we draw upon a corpus of around 50,000 articles downloaded from the ACL Anthology. Based on a list of keywords retrieved from the literature and revised in view of the task, we select from this corpus articles that can be considered to be on NLP4SG according to our definition and analyze them in terms of trends along the time line, etc. The result is a map of the current NLP4SG research and insights concerning the white spots on this map.
المراجع المستخدمة
https://aclanthology.org/
النقاش حول تغير المناخ (CC) - - مدى أسبابه، والاستجابات اللازمة - - مكثفة وعدم أهمية عالمية. ومع ذلك، في مجتمع معالجة اللغة الطبيعي (NLP)، استقبل هذا المجال حتى الآن الكثير من الاهتمام. على النقيض من ذلك، فهي بارزة هائلة في مختلف التخصصات العلوم الاج
أصبحت الأساليب الإحصائية لمعالجة اللغات الطبيعية مهيمنة في السنوات الأخيرة. يوفر هذا الكتاب تغطية واسعة وعميقة للأسس الرياضية واللغوية لهذه الطرائق، بالإضافة إلى ذلك, يزوّد الكتاب شرح مفصل للأساليب الإحصائية ، مما يسمح للطلاب والباحثين ببناء تطبيقاتهم الخاصة.
تجمع أبحاث معالجة اللغة الطبيعية (NLP) بين دراسة المبادئ العالمية، من خلال العلوم الأساسية، مع استهداف العلوم التطبيقية في حالات الاستخدام وإعدادات محددة. ومع ذلك، غالبا ما يفترض عملية التبادل بين NLP والتطبيقات الأساسية في كثير من الأحيان الظهور بشك
نقترح نقدي علامتي التعلم النشط (CAL)، وهي خوارزمية للتعلم النشطة الجديدة (AL) التي تستغل سلوك النموذج على الحالات الفردية أثناء التدريب كوكيل للعثور على أكثر الحالات إعلامية لوضع العلامات.يستقبل Cal بواسطة خرائط البيانات، التي اقترحت مؤخرا أن تستمد ا
تصف هذه الورقة إدخال مجموعة الأبحاث سيناء في مهمة SMM4H الرئيسية على تحديد المهن والمهن في وسائل التواصل الاجتماعي ذات الصلة بالصحة.على وجه التحديد، شاركنا في المهمة 7A: Tweet تصنيف ثنائي لتحديد ما إذا كانت تغريدة تحتوي على تذوق من المهن أم لا، وكذلك