ترغب بنشر مسار تعليمي؟ اضغط هنا

Stanker: شبكة التراص استنادا إلى بيرت ملثمين من الاهتمام بالاهتمام للكشف عن الشائعات على وسائل التواصل الاجتماعي

STANKER: Stacking Network based on Level-grained Attention-masked BERT for Rumor Detection on Social Media

605   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تضع الكشف عن الشائعات على وسائل التواصل الاجتماعي نماذج لغة مدربة مسبقا (LMS)، مثل Bert، والميزات المساعدة، مثل التعليقات، قيد الاستخدام. ومع ذلك، من ناحية، فإن مجموعات بيانات الكشف عن الشائعات في الشركات الصينية مع تعليقات نادرة؛ من ناحية أخرى، فإن التفاعل المكثف من الاهتمام على النماذج القائمة على المحولات مثل بيرت قد يعيق تحسين الأداء. لتخفيف هذه المشاكل، نبني مجموعة بيانات جديدة من المدونات الصغيرة الصينية تسمى Weibo20 من خلال جمع الوظائف والتعليقات المرتبطة بها من سينا ​​ويبو واقترح فرقة جديدة تسمى Stanker (Bracking Network بناء على الانتباه ملثمين). تتبنى Stanker نماذج برت ملثمين من اهتمامات اثنين من المحبوسين على مستوى تشفير قاعدة. على عكس الخطابة الأصلية، يتخذ نموذج LGAM-Bert الجديد الخاص بنا تعليقات كملفات مساعدة مهمة ويعتد على الانتباه بين الوظائف والتعليقات على الطبقات المنخفضة. أظهرت التجارب على Weibo20 وثلاث مجموعات بيانات وسائل التواصل الاجتماعي الحالية أن الستائر تفوقت على جميع النماذج المقارنة، وخاصة ضرب الدولة القديمة في مجموعة بيانات Weibo.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يمكن للكشف عن الموقف على وسائل التواصل الاجتماعي المساعدة في تحديد وفهم الأخبار أو التعليق المائل في الحياة اليومية.في هذا العمل، نقترح نموذجا جديدا للكشف عن موقف صفرية على Twitter يستخدم التعلم الخصم للتعميم عبر الموضوعات.ينص نموذجنا على الأداء الحد يث في عدد من موضوعات الاختبار غير المرئية بأقل تكلفة حسابية.بالإضافة إلى ذلك، فإننا نقوم بإعادة اكتشاف موقف الرصاص في الصفر إلى المواضيع التي لم تعتبر سابقا، وتسليط الضوء على الاتجاهات المستقبلية للتحويل الصفر بالرصاص.
يستخدم النظورات الشائعات بشكل متزايد محتوى الوسائط المتعددة لجذب الاهتمام والثقة للمستهلكين الأخبار.على الرغم من أن مجموعة من نماذج الكشف عن الشائعات قد استغلت البيانات متعددة الوسائط، إلا أنها نادرا ما تنظر في العلاقات غير المتسقة بين الصور والنصوص. علاوة على ذلك، فشلوا أيضا في العثور على طريقة قوية لتحديد معلومات التناقض بين محتويات المنشورات ومعرفة الخلفية.بدافع من الحدس أن الشائعات أكثر عرضة للحصول على معلومات غير متناسق في دلالات، ويقترح شبكة متناسقة مزدوجة موجهة إلى المعرفة على المعرفة للكشف عن شائعات مع محتويات الوسائط المتعددة.يمكنه التقاط دلالات غير متناسقة على المستوى الشامل ومستوى المعرفة المحتوى في إطار واحد موحد.تثبت تجارب واسعة على مجموعات بيانات حقيقية في العالم الحقيقي أن اقتراحنا يمكن أن يتفوق على خطوط الأساس الحديثة.
يستخدم استخدام اللغة بين المجالات وحتى داخل المجال، يتغير استخدام اللغة بمرور الوقت. بالنسبة لنماذج اللغة المدربة مسبقا مثل Bert، فقد ثبت أن تكييف المجال من خلال استمرار التدريب المستمر لتحسين الأداء في مهام Towstream داخل المجال. في هذه المقالة، يمك ننا التحقيق فيما إذا كان التكيف الزمني يمكن أن يجلب فوائد إضافية. لهذا الغرض، نقدم كذبة من وسائل التواصل الاجتماعي تعليقات عينات أكثر من ثلاث سنوات. أنه يحتوي على بيانات غير مسؤولة عن التكيف والتقييم على مهمة نمذجة لغة ملثم في المنبع بالإضافة إلى البيانات المسمى للضبط الدقيق والتقييم في مهمة تصنيف المستندات المصب. نجد أن هذه المهام في كل من المهام: التكيف الزمني يحسن أداء مهام المهام المصب والصقل الزمني الصخري. تؤدي النماذج الزمنية الخاصة عموما بشكل عام في الماضي عن مجموعات الاختبار المستقبلية، مما يطابق الأدلة على الاستخدام الدائر للكلمات الموضعية. ومع ذلك، لا يحسن تكييف Bert to Time & Domain الأداء على المهمة المصب على التكيف فقط إلى المجال. يوضح تحليل المستوى الرمز المميز أن التكيف الزمني يلتقط التغييرات التي يحركها الأحداث في استخدام اللغة في مهمة المصب، ولكن ليس هذه التغييرات ذات الصلة بالفعل بأداء المهام. بناء على النتائج التي توصلنا إليها، نناقش متى قد يكون التكيف الزمني أكثر فعالية.
في الوقت الحاضر، هناك الكثير من الإعلانات التي تختبئ كوظائف طبيعية أو مشاريع خبرة في وسائل التواصل الاجتماعي.هناك القليل من البحوث في الكشف عن الإعلانات على النصوص الصينية الماندرين.وهكذا تهدف هذه الورقة إلى التركيز على الكشف الإعلامي المخفي عن المشا ركات عبر الإنترنت في تايوان ماندرين الصينية.لقد فحصنا سبعة ميزات سياقية بناء على نظريات لغوية في مستوى الخطاب.يمكن تجميع هذه الميزات إلى ثلاثة مخططات تحت بنية الكتابة العامة العامة.نفذت هذه الميزات هذه لتدريب نموذج برت متعدد المهام للكشف عن إعلانات.اقترحت النتائج أن ميزات لغوية محددة سيساعد في استخراج إعلانات.
مجردة الكثير من العمل السابق الذي تميز تباين اللغة عبر الإنترنت، ركزت مجموعات الاجتماعية على الإنترنت على أنواع الكلمات التي تستخدمها هذه المجموعات.نحن نقدم هذا النوع من الدراسة من خلال توظيف بيرت لتوصيف الاختلاف في حواس الكلمات أيضا، وتحليل شهرين من التعليقات الإنجليزية في 474 مجتمعات Reddit.يتم استخدام خصوصية مجموعات الشعور المختلفة للمجتمع، جنبا إلى جنب مع خصوصية أنواع الكلمات الفريدة للمجتمع، لتحديد الحالات التي تنحرف فيها لغة مجموعة اجتماعية عن القاعدة.نحن نقوم بالتحقق من صحة مقاييسنا باستخدام المعلقات التي تم إنشاؤها من قبل المستخدم وارسم النظريات الاجتماعية لتوصيل تباين اللغة بالاتجاهات في سلوك المجتمع.نجد أن المجتمعات ذات اللغة المميزة للغاية هي متوسطة الحجم، وتفاعل المستخدمين المواليين والمخروطين للغاية في الشبكات الكثيفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا