ترغب بنشر مسار تعليمي؟ اضغط هنا

باستخدام تقارير ذاتية صاخبة للتنبؤ برطب مستخدم Twitter

Using Noisy Self-Reports to Predict Twitter User Demographics

96   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

غالبا ما تكون دراسات العلوم الاجتماعية الحاسوبية تحليل المحتوى في كثير من الأحيان داخل التركيبة السكانية القياسية.نظرا لأن التركيبة السكانية غير متوفرة على العديد من منصات وسائل التواصل الاجتماعي (E.G. Twitter)، فقد استنتجت الدراسات العديد من الدراسات التركيبة السكانية تلقائيا.على الرغم من العديد من الدراسات التي تقدم أداء مفهوم العرق والعرق، لا يزال تدريب النظم العملية بعيد المنال لأن هناك بعض البيانات المشروح.مجموعات البيانات الحالية صغيرة وغير دقيقة، أو تفشل في تغطية المجموعات العرقية والأعرقية الأربعة الأكثر شيوعا في الولايات المتحدة.نقدم طريقة لتحديد التقارير الذاتية عن العرق والعرق من أوصاف الملف الشخصي Twitter.على الرغم من ضجيج الإشراف الآلي، فإن مجموعات بيانات التقرير الذاتي لدينا تمكن التحسينات في أداء التصنيف على بيانات مسح التقارير الذاتية القياسية الذهبية.والنتيجة هي طريقة استنساخ لإنشاء موارد تدريبية واسعة النطاق للسباق والعرق.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يمكن أن يكون تعيين مواقع المستخدمين إلى البلدان مفيدا للعديد من التطبيقات مثل تحديد الهدوء ومجموعات المؤلف ونظام التوصية وما إلى ذلك. يسمح Twitter للمستخدمين بإعلان مواقعهم كنصا مجانيا، وغالبا ما تكون هذه المواقع المعلنة من المستخدم صاخبة وصعبة للغاي ة.في هذه الورقة، نقدم أكبر مجموعة بيانات المسمى يدويا لعودة مواقع المستخدمين على Twitter العربي إلى بلدانهم المقابلة.نبني نماذج تعليمية فعالة من الآلات التي يمكنها أتمتة هذا التعيين كفاءة أفضل بكثير مقارنة بمكتبات مثل Geopy.نظهر أيضا أن DataSet لدينا أكثر فعالية من البيانات المستخرجة من قاعدة بيانات Geonames الجغرافية في هذه المهمة حيث يغطي الأخير المواقع المكتوبة بطرق رسمية فقط.
تحقق هذه الورقة في دمج مصادر المعرفة الجودة التي طورها خبراء المجال الطبي وكذلك المعلومات الأساسية لتصنيف التغريدات إلى أربع فئات مختلفة موجهة نحو الصحة.ندعي أن موارد مثل التسلسل الهرمي للشبكة والمعلومات المتاحة حاليا هي ملحقات فعالة من مجموعات بيانا ت التدريب المعتدلة لمختلف مهام تصنيف سقسقة الرحلات الدقيقة للمشكلات الصحية المبلغ عنها ذاتيا.
في هذه الورقة، نطبق تقطير المعرفة الذاتية لتلخيص النص الذي نقوله أنه يمكن أن يخفف من مشاكل في الحد الأقصى للتدريب احتمالية على مجموعات بيانات مرجعية واحدة وصاخبة.بدلا من الاعتماد على ملصقات توضيحية ذات ساخنة واحدة، يتم تدريب نموذج تلخيص الطلاب لدينا مع توجيهات من المعلم الذي يولد ملصقات سلاسة للمساعدة في تنظيم التدريب.علاوة على ذلك، لتحسين نموذج عدم اليقين أثناء التدريب، نقدم إشارات متعددة الضوضاء لكل من نماذج المعلم والطلاب.نوضح تجريبيا في ثلاثة معايير أن إطار عملائنا يعزز أداء كل من الملاحظات المحددة أو غير مسبوقة تحقيق نتائج حالة من الفنون.
تشمل النصوص التي تم إنشاؤها من قبل المستخدم أنواعا مختلفة من الخصائص الأسلوبية، أو الضوضاء.لا تتم معالجة مثل هذه النصوص بشكل صحيح من خلال محلل مورفيم الحاليين أو نماذج اللغة القائمة على النصوص الرسمية مثل الموسوعات أو المقالات الإخبارية.في هذه الورقة ، نقترح أذكيلة بسيطة مناسبة مورفولوجية (K-MT) التي يمكن أن تعالج بشكل أفضل الأسماء المعدنية والتعاوض واللغة العامية الإنترنت من بين أنواع أخرى من الضوضاء في النصوص التي تم إنشاؤها من قبل المستخدمين الكورية.لقد اختبرنا خصومنا من خلال إجراء مهام التصنيف في مراجعات الأفلام الكورية التي أنشأها المستخدم ومجموعات بيانات الكلام الكراهية، ومجموعات بيانات التعرف على الكيان الكورية.من خلال اختباراتنا، وجدنا أن K-MT مناسبا بشكل أفضل لمعالجة علاوات الإنترنت والأسماء المناسبة والتعاملات المعدنية، مقارنة بمحلل مورفيم ومزمله لوائح التحميم على مستوى الطابع.
في هذه الورقة، نصف إدخال نظامنا للمهمة المشتركة 8 في SMM4H-2021، وهو في التصنيف التلقائي لمرورات سرطان الثدي التي تم الإبلاغ عنها على Twitter.في نظامنا، نستخدم نهج ضبط طراز بلغة قائمة على المحولات لتحديد التغريدات تلقائيا في فئة التقارير الذاتية.علاو ة على ذلك، فإننا نضمن ضبطا غرامة مقيم تدريجيا لتحسين متانة النموذج العام.حقق نظامنا درجة F1 من 0.8625 على مجموعة التطوير و 0.8501 في مجموعة الاختبار في مهمة مشتركة - 8 من SMM4H-2021.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا