ترغب بنشر مسار تعليمي؟ اضغط هنا

هبيرت + BIASCORP - مكافحة العنصرية على شبكة الإنترنت

hBERT + BiasCorp - Fighting Racism on the Web

105   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

لا تزال العنصرية الدقيقة والعلانية موجودة في المجتمعات المادية والإنترنت اليوم وتأثرت في العديد من الأرواح في قطاعات مختلفة من المجتمع. في هذه القطعة القصيرة من العمل، نقدم كيف نتعامل مع هذه القضية المجتمعية مع معالجة اللغة الطبيعية. نحن نفرج BIASCORP، مجموعة بيانات تحتوي على 139،090 تعليقات وقطاع أخبار من ثلاثة مصادر محددة - Fox News، Breitbartnews و YouTube. الدفعة الأولى (45000 المشروح يدويا) جاهز للنشر. نحن حاليا في المرحلة الأخيرة من وصف مجموعة البيانات المتبقية يدويا باستخدام Amazon Mechanical Turk. تم استخدام بيرت على نطاق واسع في العديد من المهام المصب. في هذا العمل، نقدم هيرت، حيث نقوم بتعديل طبقات معينة من نموذج برت المحدد مع طبقة Hopfield الجديدة. تعميم هيرت جيدا عبر توزيعات مختلفة مع ميزة إضافية من تعقيد نموذج مخفض. نحن نطلق أيضا مكتبة JavaScript 3 وطلب امتداد Chrome، لمساعدة المطورين على الاستفادة من نموذجنا المدربين في تطبيقات الويب (يقول تطبيق الدردشة) وللمستخدمين لتحديد وتقرير محتويات منحازة عنصري على الويب على التوالي

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يمكن لمساعدات منظمة العفو الدولية الآن تنفيذ مهام للمستخدمين بالتفاعل بشكل مباشر مع موقع UIS بشكل مباشر.لا يمكن أن تتكيف تقنيات التحليل الدلالي الحالية والفتحية بمرونة مع العديد من مواقع الويب المختلفة دون إعادة تدريبها باستمرار.نقترح Flin، وهي واجهة لغة طبيعية للملاحة على شبكة الإنترنت التي تقوم بتقدم أوامر المستخدم إلى إجراءات المستوى المفاهيم (بدلا من إجراءات UI ذات المستوى المنخفض)، وبالتالي القدرة على التكيف بمرونة مع مواقع الويب المختلفة والتعامل مع طبيعتها العابرة.نحن نؤيد ذلك كمشكلة في الترتيب: مع إعطاء أمر مستخدم وشباج ويب، يتعلم Flin تسجيل تعليمات الملاحة الأكثر صلة (تنطوي على قيم العمل والمعلمات).لتدريب وتقييم Flin، نجمع مجموعة بيانات باستخدام تسعة مواقع مشهورة من ثلاثة مجالات.تظهر نتائجنا أن Flin تمكنت من التكيف مع مواقع الويب الجديدة في مجال معين.
بالنظر إلى الطبيعة الأكثر انتشارا لواجهات اللغة الطبيعية، من المهم بشكل متزايد فهم من يصل إلى هذه الواجهات، وكيف يتم استخدام هذه الواجهات.في هذه الورقة، نستكشف التدقيق الإملائي في سياق البحث على شبكة الإنترنت مع الأطفال كجمهور مستهدف.على وجه الخصوص، عبر مراجعة الأدب، نظرا لأنه، بينما تستخدم أدوات البحث الشعبية على نطاق واسع للأطفال.ثم نستخدم إذكاء التدقيق الإملائي كدراسة للحالة لتسليط الضوء على الحاجة إلى نهج متعدد التخصصات يجمع معالجة اللغات الطبيعية والتعليم والتفاعل بين الإنسان للكهرباء لمعالجة مشكلة استرجاع المعلومات المعروفة: الاستعلام عن خطأ.نستنتج أنه من الضروري أن يكون لهؤلاء الذين تم تصميم الواجهات التي تم تصميم الواجهات صوتا في عملية التصميم.
صاغت شبكة الإنترنت إنتاجها الفريد الذي يعدُّ بنظر الكثيرين النمط الرابع للصحافة، بما تمتاز به من ميزات تجاوزت معه الكثير من العقبات التقليدية في النشر و لمكانة مدينة القدس و ظروفها الخاصة (تحت الاحتلال الإسرائيلي) تحاول الدراسة تعقب حضور المدينة الإع لامي على الإنترنت، بغرض تعرّف مقدار هذا الحضور بالقياس إلى العواصم العربية، و دراسة المحتوى الرقمي الوثائقي و المواقع التي تتناول المدينة، تجيب الدراسة عن تساؤلات عدة تتعلق بمضمون محتوى المواقع التي تتناول المدينة، حيت تم تحليل 103 وثائق باللغة العربية، 90 وثيقة باللغة الإنكليزية، و 38 موقعاً باللغة العربية و 40 موقعا باللغة الإنكليزية خلال أشهر نيسان و أيار وحزيران من عام 2009.
في فترة الوباء، فإن اتجاه الإقامة في المنزل أجبر الشركات على تبديل أنشطتها إلى الوضع الرقمي، على سبيل المثال، أساليب الدفع المستندة إلى التطبيقات، والانتعاش الاجتماعي عبر منصات وسائل التواصل الاجتماعي، والوسائل الرقمية الأخرى أصبحت جزءا لا يتجزأ من ح ياتناوبعدتحليل المعنويات للمعلومات النصية في تعليقات المستخدم هي مهمة موضحة في العاطفة AI لأن تعليقات المستخدم أو الاستعراضات ليست متجانسة، فهي تحتوي على سياق متفرق وراء ذلك، وتضلل كل من البشر والكمبيوتر.الحواجز تنشأ من اللغة العاطفية المخصبة باللغة العامية، الإملاء الغيبيري، الترجمة، واستخدام الرموز التعبيرية ونظيراتها الرمزية، وتبديل التعليمات البرمجية.بالنسبة لانخفاض تحليل المشاعر لغات الموارد لم يتم عملها على نطاق واسع، بسبب عدم وجود أدوات جاهزة والموارد اللغوية لتحليل المعنويات.يركز هذا البحث على تطوير طريقة لتحليل المعنويات المستندة إلى جانب الآراء مراجعات اللغة الكازاخستانية في سوق Google Play Android.
كان الهدف من هذا العمل هو إدخال نهج فعال يستند إلى نموذج اللغة العربية لمكافحة التغريدات Covid-19 InfoDemic.تم ترتيبها في شكل خط أنابيب من خطوتين، حيث تضمنت الخطوة الأولى سلسلة من إجراءات المعالجة المسبقة لتحويل Twitter Jargon، بما في ذلك الرموز التع بيرية والرموز، في نص عادي، واستغلت الخطوة الثانية نسخة من أرابيرت، والتيتم تدريب مسبقا على نص عادي، لضبط وتصنيف التغريدات فيما يتعلق بتسميةهم.كان استخدام نماذج اللغة المدربة مسبقا على النصوص العادية بدلا من الحصول على تغريدات من الضرورة لمعالجة قضايا نقدية مبينة من الأدبيات العلمية، وهي (1) نماذج اللغة المدربة مسبقا متوفرة على نطاق واسع في العديد من اللغات، وتجنب الوقت-Consuming والتدريب النموذجي المكثف من الموارد مباشرة على تغريدات من نقطة الصفر، مما يتيح التركيز فقط على ضبطه الجميل؛(2) النص العادي المتاح كورسا أكبر من تغريدة فقط، مما يسمح بأداء أفضل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا