ترغب بنشر مسار تعليمي؟ اضغط هنا

في هذه الورقة، نستكشف بناء تفسيرات لغة طبيعية للحصول على مطالبات الأخبار، بهدف مساعدة تطبيقات التحقق من الحقائق وتقييم الأخبار.نقوم بتجربة طريقتين: (1) طريقة استخراجية تستند إلى Textrank متحيز - خوارزمية فعالة من الموارد القائمة على الرسم البياني لاس تخراج المحتوى؛و (2) طريقة إخراج بناء على نموذج لغة GPT-2.نحن نقوم بإجراء تقييمات مقارنة على مجموعة من مجموعات البيانات الخاطئة في مجالات الأخبار السياسية والصحية، وتجد أن الطريقة الاستخراجية تظهر أكثر الوعد.
يتطلب محتوى الوسائط الاجتماعية المتغيرة بسرعة لنماذج الكشف عن إساءة الاستخدام قوية وممتع.ومع ذلك، فإن النماذج الخاضعة للإشراف على أحدث حدوث عرض الأداء المتدهورة عند تقييمها بشأن التعليقات المسيئة التي تختلف عن Training Corpus.نحقق في ما إذا كان أداء النماذج الخاضعة للإشراف للكشف عن إساءة استخدام سوريا يمكن تحسينه من خلال دمج معلومات إضافية من نماذج الموضوع، حيث يمكن أن يستنتج الأخير مخاليط الموضوعات الكامنة من العينات غير المرئية.على وجه الخصوص، نجمع بين المعلومات الموضعية مع التمثيلات من نموذج تم ضبطه لتصنيف التعليقات المسيئة.يكشف تحليل الأداء الخاص بنا أن نماذج الموضوعات قادرة على التقاط الموضوعات المتعلقة بالإساءة التي يمكنها نقلها عبر كوربورا، وتؤدي إلى تحسين التبرعات.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا