ترغب بنشر مسار تعليمي؟ اضغط هنا

نحو نماذج خطاب علم الكشف عن الأخبار المزيفة متعددة اللغات

Toward Discourse-Aware Models for Multilingual Fake News Detection

328   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعتبر البيانات التي يتم إساءة فهمها عن قصد (أو التلاعب) باهتمام كبير للباحثين والحكومة والأمن والنظم المالية. وفقا لأدب الخداع، هناك إشارات موثوقة للكشف عن الخداع والاعتقاد بأن الكذابين يعطون العظة التي قد تشير إلى أن خداعها قريب عالمي. لذلك، بالنظر إلى أن الإجراءات الخادعة تتطلب التطور المعرفي المتقدمة التي لا تتطلب الصدق ببساطة، وكذلك الآليات المعرفية للناس توجيهات واعدة للكشف عن الخداع، في هذه الدكتوراه. البحث المستمر، نقترح فحص أنماط هيكل الخطاب في كورسيا الأخبار الخادعة متعددة اللغات باستخدام إطار نظرية الهيكل البوليكي. بالنظر إلى أن عملنا هو أول من استغلال استراتيجيات إعلانات متعددة اللغات للكشف عن الأخبار المزيفة، يفتقر مجتمع البحث حاليا إلى كورسا المزدحمة الخادعة متعددة اللغات. تبعا لذلك، تصف هذه الورقة التقدم الحالي في هذه الأطروحة، بما في ذلك (1) بناء أول لجنة خادعة متعددة اللغات، مشروح من قبل المتخصصين وفقا لإطار نظرية الهيكل البوليكي، و (2) إدخال اثنين من علاقات بلاطية جديدة : التدخل والحتمية، التي نفترض أن نكون ذات صلة بمهمة الكشف عن الأخبار المزيفة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أصبحت نماذج اللغة متعددة اللغات المدربة مسبقا كتلة مبنى مهمة في معالجة اللغة الطبيعية متعددة اللغات.في الورقة الحالية، نحقق في مجموعة من هذه النماذج لمعرفة مدى نقل المعرفة على مستوى الخطاب عبر اللغات.يتم ذلك بتقييم منهجي على مجموعة أوسع من مهام مستوى الخطاب مما تم تجميعه مسبقا.نجد أن عائلة XLM-Roberta من نماذج تظهر باستمرار أفضل أداء، من خلال نماذج أحادية جيدة جيدة في وقت واحد ومهينة القليل نسبيا في إعداد طلقة صفرية.تشير نتائجنا أيضا إلى أن التقطير النموذجي قد تؤذي قدرة النقل عبر اللغات من تمثيل الجملة، في حين أن الاختلاف اللغوي على الأكثر تأثير متواضع.نأمل أن يكون جناح اختبارنا، الذي يغطي 5 مهام مع ما مجموعه 22 لغة في 10 أسر متميزة، بمثابة منصة تقييم مفيدة للأداء متعدد اللغات في مستوى الجملة وما بعدها.
يعد انتشار الأخبار المزيفة من القضايا الحالية التي تؤثر على عدد من المجالات المهمة في المجتمع ، مثل السياسة والاقتصاد والصحة. في مجال معالجة اللغة الطبيعية ، حاولت المبادرات الأخيرة الكشف عن الأخبار المزيفة بطرق مختلفة، بدءًا من الأساليب القائمة عل ى اللغة إلى التحقق القائم على المحتوى. في مثل هذه الأساليب ، يعد اختيار ميزات تصنيف الأخبار الكاذبة والحقيقية أحد أهم أجزاء العملية. تقدم هذه الورقة دراسة حول تأثير ميزات سهولة القراءة للكشف عن الأخبار المزيفة للغة البرتغالية البرازيلية. تظهر النتائج أن هذه الميزات ذات صلة بالمهمة (تحقق بمفردها دقة تصنيف تصل إلى 92٪) وقد تحسن نتائج التصنيف السابقة. (بحث انكليزي)
ألقى النمو الأسي للإنترنت والوسائط الاجتماعية في العقد الماضي الطريق إلى زيادة نشر المعلومات الخاطئة أو المضللة. منذ الانتخابات الرئاسية الأمريكية لعام 2016، أصبحت مصطلح أخبار وهمية "أصبحت شعبية متزايدة وقد تلقت هذه الظاهرة اهتماما أكبر. في السنوات ا لماضية، تم إنشاء العديد من وكالات فحص الحقائق، ولكن بسبب عدد كبير من الوظائف اليومية على وسائل التواصل الاجتماعي، والفحص اليدوي غير كاف. حاليا، هناك حاجة ملحة لأدوات الكشف عن الأخبار التلقائي، إما لمساعدة قوائم الداما اليدوية أو التشغيل كأدوات قائمة بذاتها. هناك العديد من المشاريع جارية حول هذا الموضوع، لكن معظمهم يركزون على اللغة الإنجليزية. تناقش ورقة البحث في البحث هذه توظيف أساليب التعلم العميق، وتطوير أداة، للكشف عن الأخبار الخاطئة باللغة البرتغالية. كخطوة أولى، سنقوم بمقارنة الهيغات الراسخة التي تم اختبارها بلغات أخرى وتحليل أدائها على بياناتنا البرتغالية. بناء على النتائج الأولية لهذه المصنفات، يجب أن نختار نموذجا للتعلم العميق أو الجمع بين العديد من نماذج التعلم العميق التي تعاني من وعد لتعزيز أداء نظام الكشف عن الأخبار المزيف.
تظهر أخبار Hyperpartisan التلاعب الشديد بالحقيقة بناء على اتجاه أيديولوجي أساسي ومحد للغاية. نظرا لآثارها الضارة في تعزيز تحيز الفرد والسلوك الخلفي للأشخاص، أصبح الكشف عن الأخبار Hyperpartisan مهمة مهمة بالنسبة لغوياء الحساسين. في هذه الورقة، نقوم بت قييم طريقتين مختلفتين للكشف عن أخبار فرط الاسباريسان. أولا، تقنية إخفاء نصية تسمح لنا بمقارنة الميزات المتعلقة بالموضوعات ذات الصلة بالموضوع في منظور مختلف عن العمل السابق. ثانيا، نماذج المحولات التي تعتمد على المحولات، XLM-roberta، و m-bert، المعروف بقدرتها على التقاط أنماط دلالية ونقص في نفس التمثيل. تؤكد نتائجنا البحث السابق في هذه المهمة في هذه الميزات المتعلقة بالموضوعات التي تسفر عن نتائج أفضل من تلك القائمة على النمط، على الرغم من أنها تسليط الضوء أيضا على أهمية استخدام N-WIND أعلى N-Grams. علاوة على ذلك، فإنها تظهر أن النماذج القائمة على المحولات هي أكثر فعالية من الأساليب التقليدية، ولكن هذا بتكلفة تعقيد حسابي أكبر وعدم الشفافية. استنادا إلى تجاربنا، نستنتج أن بداية الأخبار تظهر المعلومات ذات الصلة للمحولات في التمييز بفعالية بين الاتجاهات اليسارية والسائدة واليمين.
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن الأخبار المزيفة. في حين أن معظم الأعمال ومجموعات البيانات المتاحة للكشف عن الموقف يعالج النصوص القصيرة مقتطفات مستخرجة من الحوارات النصية، أو منصات وسائل التواصل الاجتماعي، أو عناوين الأخبار مع التركيز القوي على اللغة الإنجليزية، فهناك نقص في الموارد المستهدفة للنصوص الطويلة بلغات أخرى. مساهمتنا في هذه الورقة هي ذات شقين. أولا، نقدم مجموعة بيانات ألمانية من أسئلة النقاش والمقالات الإخبارية التي يتم تفاحها يدويا للكشف عن الموقف والعاطفة. ثانيا، نستفيد من مجموعة البيانات لمعالجة المهمة الخاضعة للإشراف على تصنيف موقف مقال إخباري فيما يتعلق بمسألة النقاش وتوفير نماذج خط الأساس كمرجع للعمل في المستقبل بشأن اكتشاف الموقف في المقالات الإخبارية الألمانية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا