يتم إنشاء ملايين علامة التجزئة على وسائل التواصل الاجتماعي كل يوم لإرشاد الرسائل المتعلقة بموضوعات مماثلة. لمساعدة الناس على العثور على الموضوعات التي يرغبون في مناقشتها، تقوم هذه الورقة بتفضيل تفضيلات Hashtaginging للمستخدم عبر التنبؤ بمدى المرجح أن ينشرها مع علامة التجزئة. يتم افتراض أنه يرتبط اهتمامات المرء في علامة التجزئة بما قالها قبل (سجل المستخدم) ووظائف المشاركات الحالية التي تقدم علامة التجزئة (سياقات Hashtag). هذه العوامل متزوجة في المساحة الدلالية العميقة التي بنيت برت مدرب مسبقا ونموذج موضوع عصبي عبر التعلم المتعدد. وبهذه الطريقة، يمكن تخصيص اهتمامات المستخدم المستفادة من الماضي لتتناسب مع علامة التصنيف المستقبلية التي تتجاوز قدرة الأساليب الموجودة على افتراض أن دلالات البحث في هاشتاج دون تغيير. علاوة على ذلك، نقترح انتباه موضوع شخصي مخصص رواية لالتقاط محتويات بارزة لتخصيص سياقات HASHTAG. تشير التجارب على مجموعة بيانات Twitter واسعة النطاق إلى أن نموذجنا يتفوق بشكل كبير على نهج توصية الحديث عن الفن دون استغلال موضوعات كامنة.
Millions of hashtags are created on social media every day to cross-refer messages concerning similar topics. To help people find the topics they want to discuss, this paper characterizes a user's hashtagging preferences via predicting how likely they will post with a hashtag. It is hypothesized that one's interests in a hashtag are related with what they said before (user history) and the existing posts present the hashtag (hashtag contexts). These factors are married in the deep semantic space built with a pre-trained BERT and a neural topic model via multitask learning. In this way, user interests learned from the past can be customized to match future hashtags, which is beyond the capability of existing methods assuming unchanged hashtag semantics. Furthermore, we propose a novel personalized topic attention to capture salient contents to personalize hashtag contexts. Experiments on a large-scale Twitter dataset show that our model significantly outperforms the state-of-the-art recommendation approach without exploiting latent topics.
المراجع المستخدمة
https://aclanthology.org/
أثبتت تقنيات ما قبل التدريب المسبقة بالمحولات من النص والتخطيط فعالا في عدد من مهام تفهم المستند.على الرغم من هذا النجاح، تعاني نماذج التدريب المسبق متعددة الوسائط من تكاليف حساب حسابية عالية جدا.بدافع من استراتيجيات القراءة البشرية، تقدم هذه الورقة
نماذج الموضوعات العصبية (NTMS) تطبيق الشبكات العصبية العميقة إلى نمذجة الموضوعات. على الرغم من نجاحها، تجاهل NTMS عموما جائبا مهمين: (1) فقط يتم استخدام معلومات عدد الكلمات على مستوى المستند للتدريب، في حين يتم تجاهل المزيد من المعلومات ذات المستوى ا
تشير الدراسات النفسية الأخيرة إلى أن الأفراد الذين يعرضون التفكير الانتحاري يتحول بشكل متزايد إلى وسائل التواصل الاجتماعي بدلا من ممارسي الصحة العقلية.شخصيا سياقته في تراكم هذا الاضطراب أمر بالغ الأهمية لتحديد دقيق للمستخدمين المعرضين للخطر.في هذا ال
على عكس النص المنظم جيدا، مثل التقارير الإخبارية ومقالات الموسوعة، غالبا ما يأتي محتوى الحوار من محاورين أو أكثر، وتبادل المعلومات مع بعضها البعض. في مثل هذا السيناريو، يمكن أن يختلف موضوع المحادثة عند التقدم والمعلومات الأساسية لموضوع معين في كثير م
نقترح إطارا جديدا للتنبؤ بالتقدمية الإبلاغ عن وسائل الإعلام الإخبارية من خلال دراسة دورات اهتمام المستخدمين في قنوات YouTube الخاصة بهم.على وجه الخصوص، نقوم بتصميم مجموعة غنية من الميزات المستمدة من التطور الزمني لعدد طرق العرض، الإعجابات، الكراهية،