إن استخدام CrowDWorkers في بحث NLP ينمو بسرعة، جنبا إلى جنب مع الزيادة الأسية في الإنتاج البحثي في التعلم الآلي و AI. عادة ما يقتصر المناقشة الأخلاقية المتعلقة باستخدام الجمهور في مجتمع أبحاث NLP في نطاق القضايا المتعلقة بظروف العمل مثل الأجر العادل. نلفت الانتباه إلى عدم وجود اعتبارات أخلاقية تتعلق بالمهام المختلفة التي يقوم بها العمال، بما في ذلك وضع العلامات والتقييم والإنتاج. نجد أن القاعدة النهائية، والإطار الأخلاقي المشترك الذي يستخدمه الباحثون، لم يتوقع استخدام منصات التعهيد الجماعي عبر الإنترنت لجمع البيانات، مما أدى إلى فجوات بين روح وممارسة أخلاقيات الأشخاص البشري في أبحاث NLP. نحن تعدد السيناريوهات الشائعة التي يكون فيها crowdworkers التي يقومون بها مهام NLP معرضة لخطر الأذى. وبالتالي نوصي الباحثون بتقييم هذه المخاطر من خلال النظر في المبادئ الأخلاقية الثلاثة التي أنشأها تقرير بلمونت. ونوضح أيضا بعض المفاهيم الخاطئة المشتركة فيما يتعلق بتطبيق مجلس المراجعة المؤسسية (IRB). نأمل أن تعمل هذه الورقة على إعادة فتح المناقشة داخل مجتمعنا فيما يتعلق بالاستخدام الأخلاقي للجمهور.
The use of crowdworkers in NLP research is growing rapidly, in tandem with the exponential increase in research production in machine learning and AI. Ethical discussion regarding the use of crowdworkers within the NLP research community is typically confined in scope to issues related to labor conditions such as fair pay. We draw attention to the lack of ethical considerations related to the various tasks performed by workers, including labeling, evaluation, and production. We find that the Final Rule, the common ethical framework used by researchers, did not anticipate the use of online crowdsourcing platforms for data collection, resulting in gaps between the spirit and practice of human-subjects ethics in NLP research. We enumerate common scenarios where crowdworkers performing NLP tasks are at risk of harm. We thus recommend that researchers evaluate these risks by considering the three ethical principles set up by the Belmont Report. We also clarify some common misconceptions regarding the Institutional Review Board (IRB) application. We hope this paper will serve to reopen the discussion within our community regarding the ethical use of crowdworkers.
References used
https://aclanthology.org/
In this tutorial, we aim at bringing interested NLP researchers up to speed about the recent and ongoing techniques for document-level representation learning. Additionally, our goal is to reveal new research opportunities to the audience, which will hopefully bring us closer to address existing challenges in this domain.
The purpose of the research is to provide a methodology for a fair distribution of subsidies, which helps the Syrian government in improving the living level of the Syrian family. This methodology is based on studying, classifying and ordering the living levels of the families depending on predefined indicators
Crowdsourcing from non-experts is one of the most common approaches to collecting data and annotations in NLP. Even though it is such a fundamental tool in NLP, crowdsourcing use is largely guided by common practices and the personal experience of re
This paper introduces data on translation trainees' perceptions of the MTPE process and implications on training in this field. This study aims to analyse trainees' performance of three MTPE tasks the English-Polish language pair and post-tasks inter
The objective of the research is to identify the level of the practice of secondary school
principals in Lattakia for ethical leadership from the point of view of teachers according to
the following axes: the administrative qualities of the headmas