يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن الأخبار المزيفة. في حين أن معظم الأعمال ومجموعات البيانات المتاحة للكشف عن الموقف يعالج النصوص القصيرة مقتطفات مستخرجة من الحوارات النصية، أو منصات وسائل التواصل الاجتماعي، أو عناوين الأخبار مع التركيز القوي على اللغة الإنجليزية، فهناك نقص في الموارد المستهدفة للنصوص الطويلة بلغات أخرى. مساهمتنا في هذه الورقة هي ذات شقين. أولا، نقدم مجموعة بيانات ألمانية من أسئلة النقاش والمقالات الإخبارية التي يتم تفاحها يدويا للكشف عن الموقف والعاطفة. ثانيا، نستفيد من مجموعة البيانات لمعالجة المهمة الخاضعة للإشراف على تصنيف موقف مقال إخباري فيما يتعلق بمسألة النقاش وتوفير نماذج خط الأساس كمرجع للعمل في المستقبل بشأن اكتشاف الموقف في المقالات الإخبارية الألمانية.
The widespread use of the Internet and the rapid dissemination of information poses the challenge of identifying the veracity of its content. Stance detection, which is the task of predicting the position of a text in regard to a specific target (e.g. claim or debate question), has been used to determine the veracity of information in tasks such as rumor classification and fake news detection. While most of the work and available datasets for stance detection address short texts snippets extracted from textual dialogues, social media platforms, or news headlines with a strong focus on the English language, there is a lack of resources targeting long texts in other languages. Our contribution in this paper is twofold. First, we present a German dataset of debate questions and news articles that is manually annotated for stance and emotion detection. Second, we leverage the dataset to tackle the supervised task of classifying the stance of a news article with regards to a debate question and provide baseline models as a reference for future work on stance detection in German news articles.
المراجع المستخدمة
https://aclanthology.org/
مع استمرار العالم في محاربة جائحة CovID-19، فإنه يقاتل في وقت واحد من نقص الدم "- وهو طوفان من تضليل وانتشار نظريات المؤامرة المؤدية إلى تهديدات صحية وشعبة المجتمع. لمكافحة هذا المعكرية، هناك حاجة ملحة لمجموعات البيانات القياسية التي يمكن أن تساعد ال
الهدف من الكشف عن الموقف هو تحديد ما إذا كان مؤلف النص مؤلفا مؤلا، محايد أو ضد هدف محدد. على الرغم من التقدم الجوهري في هذه المهمة، فإن إحدى التحديات المتبقية هي ندرة التعليقات التوضيحية. يستخدم تكبير البيانات بشكل شائع لمعالجة ندرة التوضيحية عن طريق
تعتبر البيانات التي يتم إساءة فهمها عن قصد (أو التلاعب) باهتمام كبير للباحثين والحكومة والأمن والنظم المالية. وفقا لأدب الخداع، هناك إشارات موثوقة للكشف عن الخداع والاعتقاد بأن الكذابين يعطون العظة التي قد تشير إلى أن خداعها قريب عالمي. لذلك، بالنظر
يشكل التعميم الشامل مسألة مهمة للكشف عن الموقف (SD).في هذه الورقة القصيرة، نقوم بالتحقيق في SD الصلبة العدسة، حيث يتم الاستفادة من المعرفة من البيانات التي تم إنشاؤها من قبل المستخدم لتحسين الأخبار SD على أهداف غير مرئية أثناء التدريب.نقوم بتنفيذ شبك
يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة