بالنظر إلى لوائح التناقض الاجتماعي الحالية في جميع أنحاء العالم، أصبحت وسائل التواصل الاجتماعي الوضع الأساسي للتواصل لمعظم الناس. وقد عزل هذا الملايين الذين يعانون من الأمراض العقلية الذين لا يستطيعون الحصول على المساعدة شخصيا. لقد تحولوا بشكل متزايد إلى المنصات عبر الإنترنت للتعبير عن أنفسهم والبحث عن إرشادات في التعامل مع أمراضهم. مع مراعاة ذلك، نقترح حلا لتصنيف وظائف المرض العقلي على وسائل التواصل الاجتماعي مما يتيح للمستخدمين طلب المساعدة المناسبة. في هذا العمل، صنف خمسة أنواع بارزة من الأمراض العقلية - الاكتئاب والقلق والاضطراب الثنائي القطبية و ADHD و PTSD عن طريق تحليل بيانات المستخدم غير منظم على Reddit. بالإضافة إلى ذلك، نشارك بيانات DataSet1 جديدة عالية الجودة لدفع البحث في هذا الموضوع. تتكون DataSet من عنوان ونصوص نشرها من 17159 وظيفة و 13 Subreddits كل واحد مرتبط بأحد الأمراض العقلية الخمس المذكورة أعلاه أو بدون فئة تشير إلى عدم وجود أي مرض عقلي. يتم تدريب النموذج الخاص بنا على بيانات Reddit ولكنه قابل للتوسيع بسهولة لمنصات وسائل التواصل الاجتماعي الأخرى وكذلك أظهرت في نتائجنا. نعتقد أن عملنا هو أول نموذج متعدد الطبقات يستخدم بنية تحويل محولات مثل روبرتا لتحليل عواطف الناس و علم النفس. نحن نوضح أيضا كيف نشدد اختبار نموذجنا باستخدام الاختبار السلوكي. تتوفر DataSet علنا علنا ونشجع الباحثين على الاستفادة من ذلك لتحقيق البحث في هذه الساحة. نأمل أن يساهم هذا العمل في نظام الصحة العامة بأتمتة بعض عمليات الكشف وتنبيه السلطات المختصة عن المستخدمين الذين يحتاجون إلى مساعدة فورية.
Given the current social distancing regulations across the world, social media has become the primary mode of communication for most people. This has isolated millions suffering from mental illnesses who are unable to receive assistance in person. They have increasingly turned to online platforms to express themselves and to look for guidance in dealing with their illnesses. Keeping this in mind, we propose a solution to classify mental illness posts on social media thereby enabling users to seek appropriate help. In this work, we classify five prominent kinds of mental illnesses- depression, anxiety, bipolar disorder, ADHD and PTSD by analyzing unstructured user data on Reddit. In addition, we share a new high-quality dataset1 to drive research on this topic. The dataset consists of the title and post texts from 17159 posts and 13 subreddits each associated with one of the five mental illnesses listed above or a None class indicating the absence of any mental illness. Our model is trained on Reddit data but is easily extensible to other social media platforms as well as demonstrated in our results.We believe that our work is the first multi-class model that uses a Transformer based architecture such as RoBERTa to analyze people's emotions and psychology. We also demonstrate how we stress test our model using behavioral testing. Our dataset is publicly available and we encourage researchers to utilize this to advance research in this arena. We hope that this work contributes to the public health system by automating some of the detection process and alerting relevant authorities about users that need immediate help.
References used
https://aclanthology.org/
Mental health is getting more and more attention recently, depression being a very common illness nowadays, but also other disorders like anxiety, obsessive-compulsive disorders, feeding disorders, autism, or attention-deficit/hyperactivity disorders
Existing work on automated hate speech classification assumes that the dataset is fixed and the classes are pre-defined. However, the amount of data in social media increases every day, and the hot topics changes rapidly, requiring the classifiers to
Language use differs between domains and even within a domain, language use changes over time. For pre-trained language models like BERT, domain adaptation through continued pre-training has been shown to improve performance on in-domain downstream t
The framing of political issues can influence policy and public opinion. Even though the public plays a key role in creating and spreading frames, little is known about how ordinary people on social media frame political issues. By creating a new dat
Nowadays, there are a lot of advertisements hiding as normal posts or experience sharing in social media. There is little research of advertorial detection on Mandarin Chinese texts. This paper thus aimed to focus on hidden advertorial detection of o