تقدير حساسية السياق في اكتشاف السمية


الملخص بالعربية

مشاركات المستخدم التي تعتمد سممتها المتصورة على سياق المحادثة نادرة في مجموعات بيانات الكشف عن السمية الحالية.وبالتالي، فإن كاشفات السمية المدربين على مجموعات البيانات الحالية ستتجاهل السياق أيضا، مما يجعل اكتشاف سمية حساسة للسياق أكثر صعوبة بكثير عند حدوث ذلك.قمنا بناؤنا وتحرير علني مجموعة بيانات من مشاركات 10K مع نوعين من تسميات سمية لكل مشاركة، تم الحصول عليها من المعلقين الذين اعتبروا (ط) كل من المنصب الحالي والآخر سياق، أو (II) فقط الوظيفة الحالية فقط.نقدم مهمة جديدة، وتقدير حساسية السياق، الذي يهدف إلى تحديد المشاركات التي تتغير سميةها المتصورة إذا تم النظر في السياق (المنشور السابق) أيضا.باستخدام DataSet الجديد، نظهر أن الأنظمة يمكن تطويرها لهذه المهمة.يمكن استخدام هذه الأنظمة لتعزيز مجموعات بيانات الكشف عن السمية مع المزيد من المشاركات التي تعتمد على السياق أو أن توحي عندما ينبغي للمشرفين النظر في الوظائف الأصلية، والتي قد لا تكون ضرورية دائما وقد تقدم تكاليف إضافية.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث