ترغب بنشر مسار تعليمي؟ اضغط هنا

الكشف الإعلامي المخفي على وسائل التواصل الاجتماعي باللغة الصينية

Hidden Advertorial Detection on Social Media in Chinese

675   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في الوقت الحاضر، هناك الكثير من الإعلانات التي تختبئ كوظائف طبيعية أو مشاريع خبرة في وسائل التواصل الاجتماعي.هناك القليل من البحوث في الكشف عن الإعلانات على النصوص الصينية الماندرين.وهكذا تهدف هذه الورقة إلى التركيز على الكشف الإعلامي المخفي عن المشاركات عبر الإنترنت في تايوان ماندرين الصينية.لقد فحصنا سبعة ميزات سياقية بناء على نظريات لغوية في مستوى الخطاب.يمكن تجميع هذه الميزات إلى ثلاثة مخططات تحت بنية الكتابة العامة العامة.نفذت هذه الميزات هذه لتدريب نموذج برت متعدد المهام للكشف عن إعلانات.اقترحت النتائج أن ميزات لغوية محددة سيساعد في استخراج إعلانات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعتمد منصات وسائل التواصل الاجتماعي عبر الإنترنت على نحو متزايد على تقنيات معالجة اللغة الطبيعية (NLP) للكشف عن محتوى مسيء على نطاق واسع من أجل تخفيف الأضرار التي يسببها لمستخدميها. ومع ذلك، فإن هذه التقنيات تعاني من مختلف تحيزات أخذ العينات والجمعية الموجودة في البيانات التدريبية، والتي غالبا ما تؤدي إلى أداء الفرعية على المحتوى ذي الصلة بالمجموعات المهمشة، مما يحتمل أن يؤدي إلى أضرار غير متناسبة تجاههم. ركزت دراسات حول مثل هذه التحيزات حتى الآن على حفنة فقط من محاور التباينات والمجموعات الفرعية التي تحتوي على التعليقات التوضيحية / المعجم المتاحة. وبالتالي، يتم تجاهل التحيزات المتعلقة بالسياقات غير الغربية إلى حد كبير في الأدبيات. في هذه الورقة، نقدم طريقة خاضعة للإشراف ضعيفا للكشف عن التحيزات المعجمية بقوة في السياقات الجغرافية الثقافية الأوسع نطاقا. من خلال دراسة الحالة حول نموذج كشف للسمية المتوفرة للجمهور، نوضح أن طريقتنا تحدد المجموعات البارزة من الأخطاء المتبادلة الجغرافية، وفي متابعة، توضح أن هذه التجمعات تعكس الأحكام الإنسانية من اللغة الهجومية واللغة الفعلية في تلك السياقات الجغرافية. نحن أيضا إجراء تحليل نموذج تدرب على مجموعة بيانات مع ملصقات الحقيقة الأرضية لفهم هذه التحيزات بشكل أفضل، وتقديم تجارب التخفيف الأولي.
غالبا ما تحتوي نصوص وسائل التواصل الاجتماعي مثل منشورات المدونة والتعليقات والتغريدات بلغات هجومية بما في ذلك تعليقات خطاب الكراهية العنصرية والهجمات الشخصية والتحرش الجنسي.لذلك اكتشاف الاستخدام غير المناسب للغة هو أهمية قصوى لسلامة المستخدمين وكذلك لقمع السلوك البغيض والعدوان.الأساليب الحالية لهذه المشكلة متاحة في الغالب لغات غنية بالموارد مثل الإنجليزية والألمانية.في هذه الورقة، نميز اللغة المسيئة في النيبالية، وهي لغة موارد منخفضة، تسليط الضوء على التحديات التي يجب معالجتها لمعالجة نص وسائل الإعلام الاجتماعية النيبالية.نقدم أيضا تجارب للكشف عن اللغة المسيئة باستخدام تعلم الآلات الخاضعة للإشراف.إلى جانب المساهمة في أول مناهج خط الأساس في الكشف عن اللغة الهجومية في النيبالية، نطلق أيضا على مجموعات البيانات المشروح البشرية لتشجيع البحث في المستقبل على هذا الموضوع الحاسم.
السخرية عبارة عن تعبير لغوي يستخدم في كثير من الأحيان للتواصل مع عكس ما يقال، وعادة ما يكون شيئا غير سار للغاية بقصد الإهانة أو السخرية.الغموض الكامنة في التعبيرات الساخرة يجعل اكتشاف السخرية صعبة للغاية.في هذا العمل، نركز على الكشف عن السخرية في محا دثات نصية، مكتوبة باللغة الإنجليزية، من منصات الشبكات الاجتماعية المختلفة وسائط الإعلام عبر الإنترنت.تحقيقا لهذه الغاية، نقوم بتطوير نموذج لتعلم عميق قابل للتفسير باستخدام وحدات انتباه ذاتيا متعددة الرأس والوحدات المتكررة.نظهر فعالية وتفسير نهجنا من خلال تحقيق نتائج أحدث النتائج في مجموعات البيانات من منصات الشبكات الاجتماعية ومنتديات المناقشة عبر الإنترنت والحوارات السياسية.
تصبح الصحة العقلية أكثر اهتماما مؤخرا مؤخرا، والاكتئاب كونه مرض شائع جدا في الوقت الحاضر، ولكن أيضا اضطرابات أخرى مثل القلق أو الاضطرابات القهرية الهوس أو اضطرابات التغذية أو اضطرابات نقص الانتباه / اضطرابات نقص الانتباه / فرط النشاط. توفر كمية كبيرة من البيانات من وسائل التواصل الاجتماعي والسلف الحديث لنماذج التعلم العميق وسيلة قيمة للكشف عن الاضطرابات النفسية تلقائيا من نص عادي. في هذه المقالة، نقوم بتجربة أساليب حديثة في مجموعة بيانات الصحة العقلية SMHD من Reddit (كوهان وآخرون، 2018). مساهمتنا ثلاثة أضعاف: استخدام مجموعة بيانات تتكون من المزيد من الأمراض أكثر من معظم الدراسات، مع التركيز على النص العام بدلا من مجموعات دعم الصحة العقلية والتصنيف من قبل الوظائف بدلا من الأفراد أو المجموعات. بالنسبة للتصنيف التلقائي للأمراض، فإننا نوظف ثلاث نماذج تعليمية عميقة: بيرت روبرتا و XLNet. نحن مضاعفة خط الأساس الذي أنشأه كوهان وآخرون. (2018)، على عينة فقط من مجموعة البيانات الخاصة بهم. نحن نحسن النتائج التي حصلت عليها جيانغ وآخرون. (2020) على تصنيف ما بعد المستوى. إن الدقة التي حصلت عليها مصنف اضطراب الأكل هو أعلى نظرا للوجود الحامل للمناقشات المتعلقة بالسعرات الحرارية والوجبات الغذائية والوصفات وما إلى ذلك، في حين أن الاكتئاب كان لديه أدنى درجة F1، ربما لأن الاكتئاب أكثر صعوبة في تحديد الأفعال اللغوية.
يمكن للكشف عن الموقف على وسائل التواصل الاجتماعي المساعدة في تحديد وفهم الأخبار أو التعليق المائل في الحياة اليومية.في هذا العمل، نقترح نموذجا جديدا للكشف عن موقف صفرية على Twitter يستخدم التعلم الخصم للتعميم عبر الموضوعات.ينص نموذجنا على الأداء الحد يث في عدد من موضوعات الاختبار غير المرئية بأقل تكلفة حسابية.بالإضافة إلى ذلك، فإننا نقوم بإعادة اكتشاف موقف الرصاص في الصفر إلى المواضيع التي لم تعتبر سابقا، وتسليط الضوء على الاتجاهات المستقبلية للتحويل الصفر بالرصاص.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا