لا تزال العنصرية الدقيقة والعلانية موجودة في المجتمعات المادية والإنترنت اليوم وتأثرت في العديد من الأرواح في قطاعات مختلفة من المجتمع. في هذه القطعة القصيرة من العمل، نقدم كيف نتعامل مع هذه القضية المجتمعية مع معالجة اللغة الطبيعية. نحن نفرج BIASCORP، مجموعة بيانات تحتوي على 139،090 تعليقات وقطاع أخبار من ثلاثة مصادر محددة - Fox News، Breitbartnews و YouTube. الدفعة الأولى (45000 المشروح يدويا) جاهز للنشر. نحن حاليا في المرحلة الأخيرة من وصف مجموعة البيانات المتبقية يدويا باستخدام Amazon Mechanical Turk. تم استخدام بيرت على نطاق واسع في العديد من المهام المصب. في هذا العمل، نقدم هيرت، حيث نقوم بتعديل طبقات معينة من نموذج برت المحدد مع طبقة Hopfield الجديدة. تعميم هيرت جيدا عبر توزيعات مختلفة مع ميزة إضافية من تعقيد نموذج مخفض. نحن نطلق أيضا مكتبة JavaScript 3 وطلب امتداد Chrome، لمساعدة المطورين على الاستفادة من نموذجنا المدربين في تطبيقات الويب (يقول تطبيق الدردشة) وللمستخدمين لتحديد وتقرير محتويات منحازة عنصري على الويب على التوالي
Subtle and overt racism is still present both in physical and online communities today and has impacted many lives in different segments of the society. In this short piece of work, we present how we're tackling this societal issue with Natural Language Processing. We are releasing BiasCorp, a dataset containing 139,090 comments and news segment from three specific sources - Fox News, BreitbartNews and YouTube. The first batch (45,000 manually annotated) is ready for publication. We are currently in the final phase of manually labeling the remaining dataset using Amazon Mechanical Turk. BERT has been used widely in several downstream tasks. In this work, we present hBERT, where we modify certain layers of the pretrained BERT model with the new Hopfield Layer. hBert generalizes well across different distributions with the added advantage of a reduced model complexity. We are also releasing a JavaScript library 3 and a Chrome Extension Application, to help developers make use of our trained model in web applications (say chat application) and for users to identify and report racially biased contents on the web respectively
المراجع المستخدمة
https://aclanthology.org/
يمكن لمساعدات منظمة العفو الدولية الآن تنفيذ مهام للمستخدمين بالتفاعل بشكل مباشر مع موقع UIS بشكل مباشر.لا يمكن أن تتكيف تقنيات التحليل الدلالي الحالية والفتحية بمرونة مع العديد من مواقع الويب المختلفة دون إعادة تدريبها باستمرار.نقترح Flin، وهي واجهة
بالنظر إلى الطبيعة الأكثر انتشارا لواجهات اللغة الطبيعية، من المهم بشكل متزايد فهم من يصل إلى هذه الواجهات، وكيف يتم استخدام هذه الواجهات.في هذه الورقة، نستكشف التدقيق الإملائي في سياق البحث على شبكة الإنترنت مع الأطفال كجمهور مستهدف.على وجه الخصوص،
صاغت شبكة الإنترنت إنتاجها الفريد الذي يعدُّ بنظر الكثيرين النمط الرابع للصحافة، بما تمتاز به من ميزات تجاوزت معه الكثير من العقبات التقليدية في النشر و لمكانة مدينة القدس و ظروفها الخاصة (تحت الاحتلال الإسرائيلي) تحاول الدراسة تعقب حضور المدينة الإع
في فترة الوباء، فإن اتجاه الإقامة في المنزل أجبر الشركات على تبديل أنشطتها إلى الوضع الرقمي، على سبيل المثال، أساليب الدفع المستندة إلى التطبيقات، والانتعاش الاجتماعي عبر منصات وسائل التواصل الاجتماعي، والوسائل الرقمية الأخرى أصبحت جزءا لا يتجزأ من ح
كان الهدف من هذا العمل هو إدخال نهج فعال يستند إلى نموذج اللغة العربية لمكافحة التغريدات Covid-19 InfoDemic.تم ترتيبها في شكل خط أنابيب من خطوتين، حيث تضمنت الخطوة الأولى سلسلة من إجراءات المعالجة المسبقة لتحويل Twitter Jargon، بما في ذلك الرموز التع