ترغب بنشر مسار تعليمي؟ اضغط هنا

قل "نعم" إلى الإيجابية: اكتشاف اللغة السامة في مجال الاتصالات

Say `YES' to Positivity: Detecting Toxic Language in Workplace Communications

438   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الاتصالات في مكان العمل (على سبيل المثال البريد الإلكتروني والدردشة، إلخ.) هو جزء أساسي من إنتاجية المؤسسة. المحادثات الصحية أمر حاسم لإنشاء بيئة شاملة والحفاظ على الوئام في منظمة. يمكن للاتصالات السامة في مكان العمل أن تؤثر سلبا على الرضا الوظيفي الإجمالي وغالبا ما تكون خفية أو مخفية أو إظهار تحيزات بشرية. جعلت الدقة اللغوية للمحادثات الخفيفة والأذى من الصعب على الباحثين تحديدها واستخراج المحادثات السامة تلقائيا. في حين أن اللغة الهجومية أو الكلام الكراهية قد درست على نطاق واسع في المجتمعات الاجتماعية، إلا أنه كان هناك القليل من العمل في دراسة الاتصالات السامة في رسائل البريد الإلكتروني. على وجه التحديد، فإن عدم وجود كوربوس، Sparsity من السمية في رسائل البريد الإلكتروني للمؤسسات، ومعايير محددة جيدا للتسجيل المحادثات السامة قد منع الباحثون من معالجة المشكلة على نطاق واسع. نأخذ الخطوة الأولى نحو دراسة السمية في رسائل البريد الإلكتروني في مكان العمل من خلال توفير (1) تصنيفا عاما وقابل للاستثناء بشكل خاص لدراسة اللغة السامة في مكان العمل (2) مجموعة بيانات لدراسة اللغة السامة في مكان العمل بناء على التصنيف و (3) تحليل لماذا لا تكون مجموعات البيانات الهجومية والكراهية مناسبة للكشف عن سمية مكان العمل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يلعب الكشف التلقائي باللغة السامة دورا أساسيا في حماية مستخدمي الوسائط الاجتماعية، وخاصة مجموعات الأقليات، من الإساءة اللفظية.ومع ذلك، فإن التحيزات تجاه بعض الصفات، بما في ذلك النوع الاجتماعي والعرق واللهجة، موجودة في معظم مجموعات البيانات التدريبية للكشف عن السمية.تحيزات تجعل النماذج المستفادة غير عادلة ويمكن أن تؤدي إلى تفاقم تهميش الناس.بالنظر إلى أن طرق الدخل الحالية لمهام فهم اللغة الطبيعية العامة لا يمكن أن تخفف بشكل فعال من التحيزات في كاشفات السمية، نقترح استخدام الترشيد الثابت (invrat)، وهو إطار نظري للعبة يتكون من مولد الأساس المنطقي والتوقع، لاستبعاد الزائفةالارتباط ببعض الأنماط النحوية (على سبيل المثال، يذكر الهوية، لهجة) إلى تسميات السمية.نظرا لإيذاء أن طريقتنا تنتج معدل إيجابي كاذب أقل في كل من الصفات المعجمية واللهائية من أساليب الدخل السابقة.
تتطلب مهمة الكشف عن المسافة السامة في Semeval-2021 المشاركين الذين يتعين على المشاركين التنبؤ بالوظائف السامة التي كانت مسؤولة عن الملصق السام للوظائف.يمكن معالجة المهمة كمصموع تسلسل إشراف، باستخدام بيانات التدريب مع يمتد سامة الذهب المقدمة من المنظم ين.يمكن التعامل معها أيضا على أنها استخراج الأساس المنطقي، باستخدام مصنفات مدربين على مجموعات بيانات خارجية أكبر من الوظائف المشروحة يدويا على أنها سامة أم لا، دون شروح سامةبالنسبة لنهج وضع التسلسل الإشرافي وأغراض التقييم، كانت الوظائف التي سبق وصفها بأنها سامة مشروحة من أشكال الجماهير السامة.قدم المشاركون يمتدين المتوقعين من أجل مجموعة اختبار محمولة وسجلوا باستخدام F1 القائمة على الطابع.يلخص النظرة نظرة عامة عمل الفرق 36 التي قدمت أوصاف النظام.
نستفيد من BLSTM مع الاهتمام لتحديد المواقف السامة في النصوص.نستكشف أبعاد مختلفة تؤثر على أداء النموذج.البعد الأول الذي تم استكشافه هو المجموعة السامة يتم تدريب النموذج.إلى جانب مجموعة البيانات المقدمة، نستكشف قدرة تحويل 5 مجموعات ذات صلة سامة مختلفة، بما في ذلك مجموعات الهجومية والسامة والمسيئة والكراهية.نجد أن المجموعة المسيئة فقط تظهر أعلى وعد القدرة على التحويل.البعد الثاني الذي نستكشفه هو المنهجية، بما في ذلك الاستفادة من الاهتمام، وتوظيف طريقة إزالة الجشع، باستخدام نسبة التردد، وفحص المجموعات الهجينة من طرق متعددة.نقوم بإجراء تحليل خطأ لفحص أنواع الأيوب السامة التي تم تفويتها والتي تم استنتاجها بشكل خاطئ على أنها سامة مع الأسباب الرئيسية وراء حدوثها.أخيرا، نقوم بتوسيع نطاق أسلوبنا عبر الفرع، والذي يحقق أعلى درجة F1 لدينا من 55.1.
من أجل توفير الرعاية عالية الجودة، يجب على المهنيين الصحيين تحديد الوجود أو احتمال أو عدم وجود الأعراض والعلاجات وغيرها من الكيانات ذات الصلة في الملاحظات السريرية النصية.هذه هي مهمة اكتشاف التأكيد - لتحديد فئة التأكيد (الحاضر، ممكن، غائبة) من كيان ب ناء على إشارات نصية في النص غير المنظم.نقيم نماذج اللغة الطبية الحديثة في المهمة وإظهار أنها تتفوق على الأساس في جميع الفئات الثلاثة.نظرا لأن قابلية النقل مهمة بشكل خاص في المجال الطبي، فإننا ندرس كيفية تصرف أفضل نموذج أداء على البيانات غير المرئية من مجموعات بيانات طبية أخرى.لهذا الغرض، نقدم مجموعة مشروحة حديثا من 5000 تأكيد لمجموعة بيانات MIMIC-III المتاحة للجمهور.نستنتج مع تحليل خطأ يكشف المواقف التي لا تزال النماذج خاطئة ونقاط نحو اتجاهات البحث في المستقبل.
في السنوات الأخيرة، أدى الاستخدام الواسع للوسائط الاجتماعية إلى زيادة في جيل من المحتوى السام والهجومي على المنصات عبر الإنترنت. استجابة، عملت منصات وسائل التواصل الاجتماعي على تطوير أساليب الكشف التلقائي وتوظيف المشرفين البشري للتعامل مع هذا الطوفان من المحتوى الهجومي. في حين تم تطبيق العديد من النماذج الإحصائية للحدث من بين الفنون للكشف عن الوظائف السامة، لا توجد سوى عدد قليل من الدراسات التي تركز على الكشف عن الكلمات أو التعبيرات التي تشكل هجوما بعد. هذا يحفز تنظيم مهمة Semeval-2021 5: مسابقة الكشف عن المسافات السامة، التي قدمت المشاركين مع مجموعة بيانات تحتوي على شرح سام يمتد في المشاركات الإنكليزية. في هذه الورقة، نقدم دخول WLV-RIT لمهمة Semeval-2021 5. يحقق نموذجنا الأفضل أداء محول العصبي 0.68 F1 درجة. علاوة على ذلك، نقوم بتطوير إطار مفتوح المصدر للكشف المتعدد اللغات عن الممثل الهجومي، أي القنص، بناء على المحولات العصبية التي تكتشف تمديد السام في النصوص.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا