نقدم مجموعة بيانات تتكون من مقالات إخبارية ألمانية تسمى التحيز السياسي على مقياس من خمس نقاط في طريقة نصف إشراف.في حين أن العمل المبكر على الكشف عن الأخبار Hyperpartisan يستخدم التصنيف الثنائي (أي Hyperpartisan أو لا) وبيانات اللغة الإنجليزية، فإننا نقول للحصول على تصنيف أكثر غرامة، تغطي الطيف السياسي الكامل (أي بعيدا، اليسار، اليسار، المركز، اليمين، بعيدا- رايت) ولمنس البحث إلى البيانات الألمانية.فهم التحيز السياسي يساعد بدقة في اكتشاف خطاب الكراهية وإساءة الاستخدام عبر الإنترنت.نقوم بتجربة أساليب تصنيف مختلفة للكشف عن التحيز السياسي.تؤكد أدائها المنخفض نسبيا (ماكرو-F1 من 43 من أفضل إعداد لدينا، مقارنة ب Macro-F1 من 79 بمهمة التصنيف الثنائية) إلى الحاجة إلى بيانات أكثر (متوازنة) المشروح بطريقة محترمة بشكل جيد.
We present a data set consisting of German news articles labeled for political bias on a five-point scale in a semi-supervised way. While earlier work on hyperpartisan news detection uses binary classification (i.e., hyperpartisan or not) and English data, we argue for a more fine-grained classification, covering the full political spectrum (i.e., far-left, left, centre, right, far-right) and for extending research to German data. Understanding political bias helps in accurately detecting hate speech and online abuse. We experiment with different classification methods for political bias detection. Their comparatively low performance (a macro-F1 of 43 for our best setup, compared to a macro-F1 of 79 for the binary classification task) underlines the need for more (balanced) data annotated in a fine-grained way.
المراجع المستخدمة
https://aclanthology.org/
مع استمرار العالم في محاربة جائحة CovID-19، فإنه يقاتل في وقت واحد من نقص الدم "- وهو طوفان من تضليل وانتشار نظريات المؤامرة المؤدية إلى تهديدات صحية وشعبة المجتمع. لمكافحة هذا المعكرية، هناك حاجة ملحة لمجموعات البيانات القياسية التي يمكن أن تساعد ال
تحيز وسائل الإعلام هي ظاهرة سائدة موجودة في معظم أشكال الوسائط المطبوعة والإلكترونية مثل المقالات الإخبارية والمدونات أو التغريدات، وما إلى ذلك. نظرا لأن وسائل الإعلام تلعب دورا محوريا في تشكيل الرأي العام تجاه الأحداث السياسية، غالبا ما تستخدم كل من
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن
قدم الصفات مثل الثقيلة (كما هو الحال في الأمطار الغزيرة) والرياح (كما في يوم عاصف) القيم المحتملة لشدة السمات ومناخها على التوالي. لا تتحقق السمات نفسها بشكل علني وهناها هذه المنطقة الضالة. في حين يمكن استنتاج هذه السمات بسهولة من قبل البشر، فإن تصني
لفتت تلخيص الحوار اهتماما كبيرا مؤخرا. خاصة في مجال خدمة العملاء، يمكن للوكلاء استخدام ملخصات الحوار للمساعدة في زيادة أعمالهم من خلال معرفة قضايا العملاء بسرعة وتقدم الخدمة. تتطلب هذه التطبيقات ملخصات لاحتواء منظور مكبر صوت واحد ولديك هيكل تدفق موضو