تطبق هذه الورقة نمذجة الموضوع لفهم موضوعات صحة الأم والاهتمامات والأسئلة المعبرين عنها في المجتمعات عبر الإنترنت على مواقع الشبكات الاجتماعية.ندرس تحليل Dirichlet الكامن (LDA) وطريقين حديثين: نموذج موضوع عصبي مع تقطير المعرفة (KD) ونموذج الموضوع المدمج (ETM) على نصوص صحة الأم يتم جمعها من Reddit.يتم تقييم النماذج على جودة موضوع الاستدلال والموضوع، باستخدام مقاييس التقييم التلقائي والتقييم البشري.نحن نحلل قطع اتصال بين المقاييس التلقائية والتقييمات البشرية.في حين أن LDA يؤدي الأفضل بشكل عام مع مقاييس التقييم التلقائي NPMI والتماسك، فإن نموذج الموضوع العصبي مع تقطير المعرفة مواتية من خلال تقييم الخبراء.ونحن أيضا إنشاء خبير جديد جزئيا مشروح موضوع صحة الأم
This paper applies topic modeling to understand maternal health topics, concerns, and questions expressed in online communities on social networking sites. We examine Latent Dirichlet Analysis (LDA) and two state-of-the-art methods: neural topic model with knowledge distillation (KD) and Embedded Topic Model (ETM) on maternal health texts collected from Reddit. The models are evaluated on topic quality and topic inference, using both auto-evaluation metrics and human assessment. We analyze a disconnect between automatic metrics and human evaluations. While LDA performs the best overall with the auto-evaluation metrics NPMI and Coherence, Neural Topic Model with Knowledge Distillation is favorable by expert evaluation. We also create a new partially expert annotated gold-standard maternal health topic
المراجع المستخدمة
https://aclanthology.org/
على الرغم من أن Word Adgeddings والمواضيع هي تمثيل تكميلي، إلا أن العديد من الأعمال السابقة استخدمت فقط Arestrained Word Areging في النمذجة الموضوعية (العصبية) لمعالجة Sparsity البيانات في نص قصير أو مجموعة صغيرة من المستندات. يعرض هذا العمل إطارا لل
الشخصية والتركيبة السكانية هي متغيرات مهمة في العلوم الاجتماعية والتطبيقات الاجتماعية الحسابية.ومع ذلك، فإن مجموعات البيانات مع كل من الشخصية والملصقات الديموغرافية نادرة.لمعالجة هذا، نقدم باندورا، أول مجموعة بيانات من تعليقات Reddit من مستخدمي 10K ا
نقدم في هذا البحث تطبيق جديد للرسوم البيانية لمعامل الديناميكي( DFGs )، و الذي يختص بنمذجة موضوع، تصنيف النص و استرجاع المعلومات.هذه العوامل الديناميكية مصممة لتشكل متتالية من
الوثائق ذات الطابع الزمني. اعتماداً على أساس فن معمارية الترميز التلقائي،
حاز موضوع الصيانة على اهتمام كبير في مجال البحث العلمي و ظهرت الحاجة لاستخدام تقنيات جديدة في إدارة أعمال الصيانة، حيث أن إدارة المنشأة تتعامل مع كم كبير من المعلومات المتعلقة بالصيانة و التي تتضمن الرسوم و المواصفات و القوائم و التقارير علماً أن است
يعتبر التلامس الفوري جلد-جلد (Skin to Skin Contact (SSC)) بين الأم و رضيعها بعد الولادة مباشرةً إجراء هام يجب أن تتضمنه الرعاية المقدمة للأم يعود عليها و على وليدها بالعديد من الفوائد الصحية, و تشكل رغبة الأم و ردود فعلها تجاهه العامل الحاسم في نجاح