ترغب بنشر مسار تعليمي؟ اضغط هنا

اكتشاف الأخبار المزيفة اعتماداً على معيار سهولة القراءة (مقروئية)

Measuring the Impact of Readability Features in Fake News Detection

1138   1   0   0.0 ( 0 )
 نشر من قبل LREC 2020 ورقة بحثية
 تاريخ النشر 2020
  مجال البحث الهندسة المعلوماتية
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعد انتشار الأخبار المزيفة من القضايا الحالية التي تؤثر على عدد من المجالات المهمة في المجتمع ، مثل السياسة والاقتصاد والصحة. في مجال معالجة اللغة الطبيعية ، حاولت المبادرات الأخيرة الكشف عن الأخبار المزيفة بطرق مختلفة، بدءًا من الأساليب القائمة على اللغة إلى التحقق القائم على المحتوى. في مثل هذه الأساليب ، يعد اختيار ميزات تصنيف الأخبار الكاذبة والحقيقية أحد أهم أجزاء العملية. تقدم هذه الورقة دراسة حول تأثير ميزات سهولة القراءة للكشف عن الأخبار المزيفة للغة البرتغالية البرازيلية. تظهر النتائج أن هذه الميزات ذات صلة بالمهمة (تحقق بمفردها دقة تصنيف تصل إلى 92٪) وقد تحسن نتائج التصنيف السابقة. (بحث انكليزي)


ملخص البحث
تتناول هذه الورقة البحثية دراسة تأثير ميزات القابلية للقراءة في اكتشاف الأخبار الزائفة باللغة البرتغالية البرازيلية. تُظهر النتائج أن هذه الميزات ذات صلة كبيرة بالمهمة، حيث تحقق دقة تصنيف تصل إلى 92% عند استخدامها بمفردها، ويمكن أن تحسن النتائج السابقة في هذا المجال. تتناول الورقة أيضًا مقارنة بين الأساليب المختلفة لاكتشاف الأخبار الزائفة، بما في ذلك الأساليب الشبكية والأساليب اللغوية، وتستعرض الأدوات والموارد المستخدمة لاستخراج ميزات القابلية للقراءة. تُظهر التجارب أن دمج ميزات القابلية للقراءة مع الميزات اللغوية الأخرى يمكن أن يحسن دقة التصنيف إلى 93%. تقترح الورقة أيضًا اتجاهات مستقبلية للبحث، بما في ذلك دراسة ميزات التركيب النحوي والدلالي وتأثيرها على اكتشاف الأخبار الزائفة.
قراءة نقدية
دراسة نقدية: تعتبر هذه الورقة البحثية إضافة قيمة إلى مجال اكتشاف الأخبار الزائفة، خاصة فيما يتعلق باللغة البرتغالية البرازيلية. ومع ذلك، يمكن توجيه بعض الانتقادات البناءة لتحسين العمل المستقبلي. أولاً، تعتمد الدراسة بشكل كبير على ميزات القابلية للقراءة، والتي قد لا تكون كافية بمفردها لاكتشاف جميع أنواع الأخبار الزائفة، خاصة تلك التي تحتوي على حقائق جزئية أو معلومات مضللة بشكل معقد. ثانيًا، يمكن أن تكون النتائج متحيزة بسبب طبيعة مجموعة البيانات المستخدمة، والتي قد لا تمثل جميع أنواع الأخبار الزائفة بشكل كامل. ثالثًا، يمكن تحسين الدراسة من خلال استكشاف تأثير ميزات أخرى مثل ميزات الشبكات الاجتماعية أو البيانات الوصفية. وأخيرًا، يمكن أن تكون الدراسة أكثر شمولية إذا تم تطبيقها على لغات أخرى للتحقق من عمومية النتائج.
أسئلة حول البحث
  1. ما هي الميزات الرئيسية التي تم استخدامها في هذه الدراسة لاكتشاف الأخبار الزائفة؟

    الميزات الرئيسية المستخدمة تشمل ميزات القابلية للقراءة مثل مؤشر فليش، ومؤشر برونيت، وصيغة ديل تشال، ومؤشر غونينغ فوغ، بالإضافة إلى ميزات التماسك النفسي واللغوي.

  2. ما هي دقة التصنيف التي تم تحقيقها باستخدام ميزات القابلية للقراءة فقط؟

    تم تحقيق دقة تصنيف تصل إلى 92% باستخدام ميزات القابلية للقراءة فقط.

  3. كيف يمكن تحسين دقة اكتشاف الأخبار الزائفة وفقًا للدراسة؟

    يمكن تحسين دقة اكتشاف الأخبار الزائفة من خلال دمج ميزات القابلية للقراءة مع ميزات لغوية أخرى مثل ميزات التركيب النحوي والدلالي، مما يزيد من دقة التصنيف إلى 93%.

  4. ما هي التحديات المستقبلية التي تقترحها الدراسة في مجال اكتشاف الأخبار الزائفة؟

    تقترح الدراسة استكشاف ميزات التركيب النحوي والدلالي بشكل أعمق، ودراسة تأثير ميزات القابلية للقراءة على أنواع أخرى من المحتوى المضلل مثل الأخبار الساخرة والمراجعات الرأي.


المراجع المستخدمة
Perez-Rosas, V., Kleinberg, B., Lefevre, A., and Mihalcea, ´ R. (2017). Automatic detection of fake news. CoRR, abs/1708.07104.
Perez-Rosas, V. and Mihalcea, R. (2015). Experiments in ´ open domain deception detection. In Proceedings of the Conference on Empirical Methods in Natural Language Processing, pages 1120–1125.
قيم البحث

اقرأ أيضاً

تعتبر البيانات التي يتم إساءة فهمها عن قصد (أو التلاعب) باهتمام كبير للباحثين والحكومة والأمن والنظم المالية. وفقا لأدب الخداع، هناك إشارات موثوقة للكشف عن الخداع والاعتقاد بأن الكذابين يعطون العظة التي قد تشير إلى أن خداعها قريب عالمي. لذلك، بالنظر إلى أن الإجراءات الخادعة تتطلب التطور المعرفي المتقدمة التي لا تتطلب الصدق ببساطة، وكذلك الآليات المعرفية للناس توجيهات واعدة للكشف عن الخداع، في هذه الدكتوراه. البحث المستمر، نقترح فحص أنماط هيكل الخطاب في كورسيا الأخبار الخادعة متعددة اللغات باستخدام إطار نظرية الهيكل البوليكي. بالنظر إلى أن عملنا هو أول من استغلال استراتيجيات إعلانات متعددة اللغات للكشف عن الأخبار المزيفة، يفتقر مجتمع البحث حاليا إلى كورسا المزدحمة الخادعة متعددة اللغات. تبعا لذلك، تصف هذه الورقة التقدم الحالي في هذه الأطروحة، بما في ذلك (1) بناء أول لجنة خادعة متعددة اللغات، مشروح من قبل المتخصصين وفقا لإطار نظرية الهيكل البوليكي، و (2) إدخال اثنين من علاقات بلاطية جديدة : التدخل والحتمية، التي نفترض أن نكون ذات صلة بمهمة الكشف عن الأخبار المزيفة.
مع استمرار العالم في محاربة جائحة CovID-19، فإنه يقاتل في وقت واحد من نقص الدم "- وهو طوفان من تضليل وانتشار نظريات المؤامرة المؤدية إلى تهديدات صحية وشعبة المجتمع. لمكافحة هذا المعكرية، هناك حاجة ملحة لمجموعات البيانات القياسية التي يمكن أن تساعد ال باحثين على تطوير وتقييم النماذج الموجهة نحو الكشف التلقائي عن التضليل. في حين أن هناك جهودا متزايدة لإنشاء مجموعات بيانات قياسية كافية ومفتوحة للمصدر للغة الإنجليزية، فإن الموارد القابلة للمقارنة غير متاحة تقريبا بالنسبة للألمانية، مما يترك البحث في اللغة الألمانية متخلفة بشكل كبير. في هذه الورقة، نقدم DataSet المعيار الجديد Fang-Covid يتكون من 28،056 مواد إخبارية ألمانية حقيقية و 13،186 مرتبطة بمعائق CovID-19 وكذلك بيانات عن انتشارها على Twitter. علاوة على ذلك، نقترح نموذجا قابل للتفسير القائم على السياق والاجتماعي للكشف عن الأخبار المزيفة، ومقارنة أدائه إلى النماذج والأداء الأسود الميزة لتقييم الأهمية النسبية للميزات القابلة للتفسير البشرية في التمييز بين الأخبار المزيفة من الأخبار الأصلية وبعد
أخبار وهمية تسبب أضرارا كبيرة في المجتمع.للتعامل مع هذه الأخبار المزيفة، تم إجراء العديد من الدراسات حول نماذج كشف البناء وترتيب مجموعات البيانات.معظم مجموعات بيانات الأخبار المزيفة تعتمد على فترة زمنية محددة.وبالتالي، فإن نماذج الكشف المدربة على مثل هذه البيانات لديها صعوبة في اكتشاف الأخبار الرواية المزيفة الناتجة عن التغييرات السياسية والتغيرات الاجتماعية؛قد ينتج عنهم إخراج متحيز من المدخلات، بما في ذلك أسماء شخص معين وأسماء تنظيمية.نشير إلى هذه المشكلة كتحيز DIACHRONIC لأنه سبب تاريخ إنشاء الأخبار في كل مجموعة بيانات.في هذه الدراسة، نؤكد التحيز، وخاصة الأسماء المناسبة بما في ذلك أسماء الشخص، من انحراف مظاهر العبارة في كل مجموعة بيانات.بناء على هذه النتائج، نقترح طرق الاخفاء باستخدام Wikidata للتخفيف من تأثير أسماء الشخص والتحقق من صحة ما إذا كانوا يقومون بإجراء نماذج الكشف عن الأخبار وهمية قوية من خلال التجارب مع بيانات داخل المجال والخروج.
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن الأخبار المزيفة. في حين أن معظم الأعمال ومجموعات البيانات المتاحة للكشف عن الموقف يعالج النصوص القصيرة مقتطفات مستخرجة من الحوارات النصية، أو منصات وسائل التواصل الاجتماعي، أو عناوين الأخبار مع التركيز القوي على اللغة الإنجليزية، فهناك نقص في الموارد المستهدفة للنصوص الطويلة بلغات أخرى. مساهمتنا في هذه الورقة هي ذات شقين. أولا، نقدم مجموعة بيانات ألمانية من أسئلة النقاش والمقالات الإخبارية التي يتم تفاحها يدويا للكشف عن الموقف والعاطفة. ثانيا، نستفيد من مجموعة البيانات لمعالجة المهمة الخاضعة للإشراف على تصنيف موقف مقال إخباري فيما يتعلق بمسألة النقاش وتوفير نماذج خط الأساس كمرجع للعمل في المستقبل بشأن اكتشاف الموقف في المقالات الإخبارية الألمانية.
ألقى النمو الأسي للإنترنت والوسائط الاجتماعية في العقد الماضي الطريق إلى زيادة نشر المعلومات الخاطئة أو المضللة. منذ الانتخابات الرئاسية الأمريكية لعام 2016، أصبحت مصطلح أخبار وهمية "أصبحت شعبية متزايدة وقد تلقت هذه الظاهرة اهتماما أكبر. في السنوات ا لماضية، تم إنشاء العديد من وكالات فحص الحقائق، ولكن بسبب عدد كبير من الوظائف اليومية على وسائل التواصل الاجتماعي، والفحص اليدوي غير كاف. حاليا، هناك حاجة ملحة لأدوات الكشف عن الأخبار التلقائي، إما لمساعدة قوائم الداما اليدوية أو التشغيل كأدوات قائمة بذاتها. هناك العديد من المشاريع جارية حول هذا الموضوع، لكن معظمهم يركزون على اللغة الإنجليزية. تناقش ورقة البحث في البحث هذه توظيف أساليب التعلم العميق، وتطوير أداة، للكشف عن الأخبار الخاطئة باللغة البرتغالية. كخطوة أولى، سنقوم بمقارنة الهيغات الراسخة التي تم اختبارها بلغات أخرى وتحليل أدائها على بياناتنا البرتغالية. بناء على النتائج الأولية لهذه المصنفات، يجب أن نختار نموذجا للتعلم العميق أو الجمع بين العديد من نماذج التعلم العميق التي تعاني من وعد لتعزيز أداء نظام الكشف عن الأخبار المزيف.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا