نطاق الأعمال التي يمكن اعتبارها نظامية NLP للاجتماع الاجتماعي (NLP4SG) هائلة. في حين أن الكثير منهم يستهدفون تحديد خطاب الكراهية أو الأخبار المزيفة، فهناك آخرون هذا العنوان، على سبيل المثال، تبسيط النص لتخفيف عواقب عسر القراءة، أو التدريب على استراتيجيات مكافحة الاكتئاب. ومع ذلك، حتى الآن، لا توجد صورة واضحة عن المناطق التي تستهدفها NLP4SG، وهي الجهات الفاعلة، وهي السيناريوهات الرئيسية وما هي الموضوعات التي تم تركها جانبا. من أجل الحصول على وجهة نظر أوضح في هذا الصدد، نقترح أولا تعريف عمل ل NLP4SG وتحديد بعض الجوانب الأولية التي هي حاسمة بالنسبة ل NLP4SG، بما في ذلك، على سبيل المثال، المناطق والأخلاق والخصوصية والتحيز. بعد ذلك، نسربنا على جثة تبلغ حوالي 50000 مادة تم تنزيلها من مختارات ACL. استنادا إلى قائمة الكلمات الرئيسية التي تم استرجاعها من الأدبيات المنقحة في ضوء المهمة، نختار من هذه المقالات التي يمكن اعتبارها في NLP4SG وفقا لتعريفنا وتحليلها من حيث الاتجاهات على طول الخط الزمني، إلخ. والنتيجة هي خريطة لأبحاث وأفكار NLP4SG الحالية بشأن البقع البيضاء على هذه الخريطة.
The range of works that can be considered as developing NLP for social good (NLP4SG) is enormous. While many of them target the identification of hate speech or fake news, there are others that address, e.g., text simplification to alleviate consequences of dyslexia, or coaching strategies to fight depression. However, so far, there is no clear picture of what areas are targeted by NLP4SG, who are the actors, which are the main scenarios and what are the topics that have been left aside. In order to obtain a clearer view in this respect, we first propose a working definition of NLP4SG and identify some primary aspects that are crucial for NLP4SG, including, e.g., areas, ethics, privacy and bias. Then, we draw upon a corpus of around 50,000 articles downloaded from the ACL Anthology. Based on a list of keywords retrieved from the literature and revised in view of the task, we select from this corpus articles that can be considered to be on NLP4SG according to our definition and analyze them in terms of trends along the time line, etc. The result is a map of the current NLP4SG research and insights concerning the white spots on this map.
References used
https://aclanthology.org/
The debate around climate change (CC)---its extent, its causes, and the necessary responses---is intense and of global importance. Yet, in the natural language processing (NLP) community, this domain has so far received little attention. In contrast,
Statistical approaches to processing natural language text have become dominant in recent years. It provides broad but rigorous coverage of mathematical and linguistic foundations, as well as detailed discussion of statistical methods, allowing students and researchers to construct their own implementations.
Natural language processing (NLP) research combines the study of universal principles, through basic science, with applied science targeting specific use cases and settings. However, the process of exchange between basic NLP and applications is often
We propose Cartography Active Learning (CAL), a novel Active Learning (AL) algorithm that exploits the behavior of the model on individual instances during training as a proxy to find the most informative instances for labeling. CAL is inspired by da
This paper describes the entry of the research group SINAI at SMM4H's ProfNER task on the identification of professions and occupations in social media related with health. Specifically we have participated in Task 7a: Tweet Binary Classification to