ترغب بنشر مسار تعليمي؟ اضغط هنا

كشف الدعاية القابلة للتفسير في المقالات الإخبارية

Interpretable Propaganda Detection in News Articles

262   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتعرض المستخدمون عبر الإنترنت اليوم للمقالات الإخبارية المضللة والدعاية ووظائف الإعلام على أساس يومي.وبالتالي، فقد تم تصميم عدد من الأساليب تهدف إلى تحقيق أخبار غير صحية وأكثر أمانا على الإنترنت واستهلاك وسائل الإعلام.النظم التلقائية قادرة على دعم البشر في الكشف عن هذا المحتوى؛ومع ذلك، فإن عائق كبير أمام تبنيها الواسع هو أنه بالإضافة إلى كونه دقيقا، فإن قرارات مثل هذه الأنظمة تحتاج أيضا إلى تفسيرها من أجل موثوق بها واعتمادها على نطاق واسع من قبل المستخدمين.نظرا لأن المحتوى المضلل والدعاية يؤثر على القراء من خلال استخدام عدد من تقنيات الخداع، فإننا نقترح اكتشاف وإظهار استخدام هذه التقنيات كوسيلة لتقديم إمكانية الترجمة الشفوية.على وجه الخصوص، نحدد الميزات الوصفية النوعية ونحن نحلل ملاءمتها للكشف عن تقنيات الخداع.نظل كذلك أن ميزاتنا المترجمة الخاصة بنا يمكن دمجها بسهولة مع نماذج اللغة المدربة مسبقا، مما يؤدي إلى نتائج حديثة من بين الفن.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نصف أنظمتنا من SubTask1 و SubTask3 لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور.الغرض من SubTask1 هو تحديد تقنيات الدعاية المعطاة المحتوى النصي، وهدف الفرع SubTask3 هو اكتشافها بالنظر إلى كل من المحتوى النصي والبصرية.بالنسبة إل ى SubTask1، نقوم بالتحقيق في التعلم التحويل بناء على نماذج اللغة المدربة مسبقا (PLMS) مثل بيرت، روبرتا لحل مشاكل تدفق البيانات.بالنسبة إلى SubTask3، نستخرج التمثيلات البصرية غير المتجانسة (I.E.، وميزات الوجه، وميزات OCR، والتمثيلات متعددة الوسائط) واستكشف العديد من استراتيجيات الانصهار متعددة الوسائط المتعددة للجمع بين التمثيلات النصية والمرئية.يوضح التقييم الرسمي طراز الفرع الخاص بنا يحتل المرتبة الأولى ل SubTask1 و 2 ل SubTask3.
ظهرت العديد من الطرق المستندة إلى العنقودية للكشف عن التغير الدلالي بموظفي السياق مؤخرا.إنهم يتيحون تحليلا غرامة لاستخدام كلمة التغيير عن طريق تجميع المدينات في مجموعات تعكس استخدامات الكلمة المختلفة.ومع ذلك، فإن هذه الطرق غير مستقرة من حيث استهلاك ا لذاكرة ووقت الحساب.لذلك، فإنها تتطلب مجموعة محدودة من الكلمات المستهدفة التي سيتم اختيارها مسبقا.هذا يحد بشكل كبير من قابلية استخدام هذه الأساليب في مهام الاستكشافية المفتوحة، حيث يمكن اعتبار كل كلمة من المفردات هدف محتمل.نقترح طريقة قابلة للتطوير الجديدة للكشف عن تغيير الكلمات التي توفر مكاسب كبيرة في وقت المعالجة وفورات كبيرة في الذاكرة مع تقدم نفس التفسير وأداء أفضل من الأساليب غير القابلة للتحصيل.نوضح إمكانية تطبيق الأسلوب المقترح من خلال تحليل جثة كبيرة من مقالات إخبارية حول Covid-19.
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن الأخبار المزيفة. في حين أن معظم الأعمال ومجموعات البيانات المتاحة للكشف عن الموقف يعالج النصوص القصيرة مقتطفات مستخرجة من الحوارات النصية، أو منصات وسائل التواصل الاجتماعي، أو عناوين الأخبار مع التركيز القوي على اللغة الإنجليزية، فهناك نقص في الموارد المستهدفة للنصوص الطويلة بلغات أخرى. مساهمتنا في هذه الورقة هي ذات شقين. أولا، نقدم مجموعة بيانات ألمانية من أسئلة النقاش والمقالات الإخبارية التي يتم تفاحها يدويا للكشف عن الموقف والعاطفة. ثانيا، نستفيد من مجموعة البيانات لمعالجة المهمة الخاضعة للإشراف على تصنيف موقف مقال إخباري فيما يتعلق بمسألة النقاش وتوفير نماذج خط الأساس كمرجع للعمل في المستقبل بشأن اكتشاف الموقف في المقالات الإخبارية الألمانية.
على الرغم من أن شعبية متزايدة من NLP في العلوم الإنسانية والعلوم الاجتماعية، فقد ترافق التقدم في الأداء النموذجي وتعقيد مخاوف بشأن التفسير والسلطة التوضيحية للتحليل الاجتماعي الثقافي. نموذج شعبي واحد يأخذ طريقا وسط مسافة كلمة المحرك (WMD). يتم تكييفه ا ظاهريا لتفسيرها، ومع ذلك تم استخدام WMD وتم تطويره بشكل أكبر بطرق تجاهل الجانب الأكثر تفسيرا في كثير من الأحيان: أي مسافات مستوى الكلمات المطلوبة لترجمة مجموعة من الكلمات إلى مجموعة أخرى من الكلمات. لمعالجة هذه الفجوة الواضحة، نقدم WMDECOMPOOPE: مكتبة نموذجية ومكتبة بيثون 1) تتحلل مسافات مستوى المستند في المسافات في مستوياتها المكونة على مستوى الكلمات، و 2) مجموعات في وقت لاحق من تحفيز العناصر المواضيعية، بحيث يتم الاحتفاظ بالمعلومات المعجمية المفيدة تلخيص للتحليل. لتوضيح إمكاناتها في سياق علمي اجتماعي، نطبقها على جثة وسائل التواصل الاجتماعي الطولية لاستكشاف العلاقة المتبادلة بين نظريات المؤامرة والأحرفات الأمريكية المحافظة. أخيرا، نظرا لتعقيد الوقت الكامل في الوقت الحالي، فإننا نقترح بالإضافة إلى طريقة لأخذ عينات من مجموعات البيانات الكبيرة بطريقة استنساخ، مع حدود ضيقة تمنع استقراء النتائج غير الموثوقة بسبب سوء أخذ العينات الممارسات.
من بين المهام التي تحفزها انتشار المعلومات الخاطئة، فإن اكتشاف الدعاية تحديا بشكل خاص بسبب عجز التعليقات التوضيحية الدقيقة الدقيقة اللازمة لتدريب نماذج التعلم الآلي.هنا نظهر كيف يمكن الاستفادة من البيانات من المهام الأخرى ذات الصلة، بما في ذلك تقييم المصداقية، في إطار التعلم متعدد المهام (MTL) لتسريع عملية التدريب.وتحقيقا لهذه الغاية، نقوم بتصميم نموذج يستند إلى بيرت مع طبقات إخراج متعددة، وتدريبه في العديد من سيناريوهات MTL وأداء التقييم ضد معيار الذهب السائم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا