ترغب بنشر مسار تعليمي؟ اضغط هنا

غالبا ما يمنح الباحثون الصحة والطب توصيات سريرية وسياساتية لإبلاغ الممارسة الصحية وسياسة الصحة العامة. ومع ذلك، لا يوجد نظام معلومات صحي حالي يدعم الاسترجاع المباشر للمشورة الصحية. يملأ هذه الدراسة الفجوة من خلال تطوير وتحقق من صحة نموذج التنبؤ القائ م على NLP لتحديد المشورة الصحية في المنشورات البحثية. نتشرحنا بإنشاء 6000 جمل مستخرج من الملخصات المنظمة في منشورات PubMed باعتبارها نصيحة قوية "أو نصيحة ضعيفة"، أو لا نصيحة "، أو طورت نموذجا يستند إلى بيرت يمكنه التنبؤ به، حيث بلغ متوسط ​​درجة الماكرو F1 من 0.93، ما إذا كانت الجملة تعطي نصيحة قوية أو نصيحة ضعيفة أم لا. طراز التنبؤ المعمم جيدا إلى الجمل في كل من ملخصات ومناقشات المناقشة غير المنظمة، حيث تظهر المشورة الصحية عادة. كما أجرينا دراسة حالة تطبق هذا النموذج التنبؤ هذا لاسترداد مشورة صحية محددة بشأن علاجات CovID-19 من Litcovid، وهي بوابة أدب أبحاث كوفي كبير، مما يدل على فائدة أحكام المشورة الصحية كدالة تنقل أبحاث متقدم للباحثين الصحيين عامة الناس.
مع ظهور جائحة Covid-19، تم دمج الجوانب السياسية والطبية المتمثلة في التضليل حيث حصلت المشكلة على ارتفاع إلى مستوى جديد تماما لتصبح أول انفجار عالمي. تم إعلان محاربة هذا المعف النقود أحد أهم مجالات التركيز في منظمة الصحة العالمية، مع وجود مخاطر تتراوح من تعزيز العلاجات المزيفة والشائعات ونظريات المؤامرة لنشر كراهية الأجانب والذعر. يتطلب معالجة القضية حل عدد من المشاكل الصعبة مثل تحديد الرسائل التي تحتوي على مطالبات، وتحديد الجدارة الشيكية والوصيل لها، وإمكاناتها لإيذاءها وكذلك طبيعة هذا الضرر، لنذكر عدد قليل فقط. لمعالجة هذه الفجوة، نقوم بإصدار مجموعة بيانات كبيرة من 16 ألف تغريدات مشروح يدويا لتحليل التهيئة الدقيقة التي يركز عليها (ط) على CovID-19، (II) تجمع بين وجهات النظر ومصالح الصحفيين، ومساجي الحقائق، ومنصات وسائل التواصل الاجتماعي ، صانعي السياسات، والمجتمع، و (3) يغطي العربية والكبلانية والهولندية والإنجليزية. أخيرا، نظهر نتائج تقييم قوية باستخدام محولات مسبقا، وبالتالي تؤكد الأداة المساعدة العملة لمجموعة البيانات في أحادي التوتر مقابل تعدد اللغات، ومهمة واحدة مقابل إعدادات متعددة.
استخراج المعلومات الزمنية أمر بالغ الأهمية لمعالجة النص المتعلق بالصحة. إن استخراج المعلومات الزمنية هي مهمة صعبة للنماذج اللغوية لأنها تتطلب معالجة النصوص والأرقام. علاوة على ذلك، فإن التحدي الأساسي هو كيفية الحصول على مجموعة بيانات تدريبية واسعة ال نطاق. لمعالجة هذا، نقترح خوارزمية توليد البيانات الاصطناعية. أيضا، نقترح نموذج استخراج المعلومات الزمني متعدد المهام الجديد والتحقيق فيما إذا كان التعلم متعدد المهام يمكن أن يسهم في تحسين الأداء من خلال استغلال إشارات تدريبية إضافية مع بيانات التدريب الحالية. بالنسبة للتجارب، جمعنا مجموعة بيانات مخصصة تحتوي على نصوص غير منظم مع المعلومات الزمنية للأنشطة المتعلقة بالنوم. تظهر النتائج التجريبية أن استخدام البيانات الاصطناعية يمكن أن تحسن الأداء عندما يكون عامل التكبير 3. النتائج تظهر أيضا أنه عند استخدام التعلم متعدد المهام مع كمية مناسبة من البيانات الاصطناعية، يمكن أن يتحسن الأداء بشكل كبير من 82. إلى 88.6 ومن 88.6 ومن 83.9 إلى 91.9 فيما يتعلق بعشرات المطابقة الدقيقة والمتوسط ​​الكلي من التوقعات في الوقت المحدد، على التوالي.
تلقت مهمة التحقق من صحة المطالبات في الوثائق النصية، أو فحص الحقائق، اهتماما كبيرا في السنوات الأخيرة. تحتوي العديد من مجموعات بيانات الحقائق القائمة على الأدلة الموجودة على المطالبات الاصطناعية والنماذج المدربة على هذه البيانات قد لا تتمكن من التحقق من مطالبات العالم الحقيقي. وعليا بعض الدراسات التي تعالجت التحقق من الحقائق القائمة على الأدلة للمطالبات المتعلقة بالصحة التي تتطلب الخبرات الطبية أو الأدلة من الأدبيات العلمية. في هذه الورقة، نقدم صحة، مجموعة بيانات جديدة لفحص الحقائق القائم على الأدلة للمطالبات المتعلقة بالصحة التي تسمح بدراسة صلاحية المطالبات في العالم الحقيقي من خلال تقييم صدقها ضد المقالات العلمية. باستخدام طريقة إنشاء بيانات ثلاث خطوات، استجبت لأول مرة مطالبات عالمية حقيقية من المقتطفات التي تم إرجاعها بواسطة محرك بحث للأسئلة حول CovID-19. ثم استرجاعنا تلقائيا وإعادة صياغة الأوراق العلمية ذات الصلة باستخدام نموذج T5 القائم على الصلة. وأخيرا، تم تفاح العلاقات بين كل بيان أدلة والمطالبة المرتبطة يدويا كدعم ودحض ومحايد. للتحقق من صحة مجموعة البيانات التي تم إنشاؤها من 14،330 أزواج مطالبة الأدلة، طورت نماذج خط الأساس بناء على نماذج اللغة المحددة مسبقا. أظهرت تجاربنا أن التدريبات التدريبية العميقة في المطالبات الطبية في العالم الحقيقي تعمل بشكل كبير على تحسين الأداء مقارنة بالنماذج المدربة على مطالبات الاصطناعية والمفتوحة. تشير النتائج الخاصة بنا والتحليلات اليدوية إلى أن صحية يوفر مجموعة بيانات واقعية وصعبة للجهود المستقبلية بشأن التحقق من الحقائق القائمة على الأدلة للمطالبات المتعلقة بالصحة. تتوفر DataSet، التعليمات البرمجية المصدر، لوحة المتصدرين في https://github.com/sarrouti/healthver.
تهدف التلخيص التلقائي إلى استخراج معلومات مهمة من كميات كبيرة من البيانات النصية من أجل إنشاء إصدار أقصر من النصوص الأصلية مع الحفاظ على معلوماتها. تعتمد تدريب نماذج تلخيص الاستخراجية التقليدية بشكل كبير على الملصقات المهندسة البشرية مثل التعليقات ال توضيحية على مستوى الجملة للجدارة القصيرة. ومع ذلك، في العديد من حالات الاستخدام، فإن هذه الملصقات المهندسة البشرية غير موجودة وتشريح يدويا الآلاف من المستندات لغرض نماذج التدريب قد لا تكون ممكنة. من ناحية أخرى، غالبا ما تكون إشارات غير مباشرة للتلخيص متاحة، مثل إجراءات الوكيل لحوارات خدمة العملاء، العناوين الرئيسية للمقالات الإخبارية، التشخيص للسجلات الصحية الإلكترونية، إلخ. في هذه الورقة، نقوم بتطوير إطار عام يولد تلخيصا استخراجا نتيجة ثانوية من مهام التعلم الإشراف للإشارات غير المباشرة عبر مساعدة آلية الاهتمام. نختبر نماذجنا على حوارات خدمة العملاء ونتائج التجريبية أظهرت أن نماذجنا يمكن أن تختار بشكل موثوق الجمل والكلمات الإعلامية للتلخيص التلقائي.
أدوات البناء لإزالة المعلومات الحساسة مثل الأسماء الشخصية والعناوين وأرقام الهواتف - ما يسمى بالمعلومات الصحية المحمية (PHI) - من النص الحر الإكلينيكي هي مهمة مهمة لجعل النصوص السريرية متاحة للبحث. يجب تقييم هذه أدوات تحديد الهوية فيما يتعلق بجودتها في شكل دقة القياسات وإعادة الاتصال. لتقييم هذه الأدوات، يجب أن تكون معايير الذهب - النص السريري المشروح - يجب أن تكون متاحة. هذه المعايير الذهبية موجودة لغات أكبر. للنرويجية، ماذا - على الإطلاق، لا توجد هذه الموارد. لذلك، تم تمديد كوربوس الإكلينيكي الاصطناعية النرويجية الموجودة بالفعل، Norsynthclinical، مع فيس ومشروحة من قبل اثنين من الناحيين، والحصول على اتفاقية مشتركة بين المعجبين بقيمة 0.94 F1. في المجموع، يحتوي Corpus على 409 حيلة فاي مشروحة وتسمى Norsynthclinical Phi. تم تطوير وتدريب الأداة الهجينة لإلغاء تحديد (تعلم الآلة والبيانات المستندة إلى القواعد) على النرويجية بالموارد المفتوحة المتاحة، وحصلت على تدبير إجمالي F1 من 0.73 واستدعاء 0.62، عند اختباره باستخدام Norsynthclinicalical Phi. يتم فتح Phi Norsynthclinical Phi ومتاحا في Github لاستخدامها من قبل مجتمع البحث.
نحن تصف عروضنا إلى الطبعة السادسة من المهمة المشتركة للتطبيقات الاجتماعية للتطبيقات الصحية (SMM4H).شارك فريقنا (ognlp) في المهمة الفرعية: تصنيف تغريدات القضايا المحتملة للإبلاغ عنها الذاتي (المهمة 5).بالنسبة لتقديم طلباتنا، عملنا أنظمة بناء على نماذج المحولات التراجع التلقائي (XLNET) والترجمة الخلفية لموازنة DataSet.
يركز Profner-St على اعتراف المهن والمهن من تويتر باستخدام البيانات الإسبانية.تعتمد مشاركتنا على مزيج من Adgeddings على مستوى الكلمات، بما في ذلك بيرت الإسبانية المدربة مسبقا، بالإضافة إلى تشابه التموين المحسوبة فوق مجموعة فرعية من الكيانات التي تعمل كمدخل للحصول على بنية فك تشفير التشفير مع آلية الاهتمام.أخيرا، حقق أفضل درجة لدينا قياس F1 من 0.823 في مجموعة الاختبار الرسمية.
مع الصحة العقلية كملم مشكلة في NLP، يدور الجزء الأكبر من الأدب المعاصر حول بناء نماذج تنبؤات أمرية أفضل. كان البحث التركيز على تحديد مجموعات المناقشة في مجتمعات الصحة العقلية عبر الإنترنت محدودا نسبيا. علاوة على ذلك، نظرا لأن المنهجيات الأساسية المست خدمة في هذه الدراسات تتفق بشكل أساسي مع نماذج تعليم الآلة التقليدية والأساليب الإحصائية، فإن نطاق إدخال تمثيلات الكلمات السياقية لموضوع استخراج الموضوع والشيء من المجتمعات الصحية العقلية عبر الإنترنت مفتوحة. وهكذا، في هذا البحث، نقترح تمثيل موضوعي عميق مدعوم، وهي تقنية تمثيل بيانات رواية تستخدم ABLENCODERS لجمع بين المدينات السياقية العميقة مع المعلومات الموضعية، وتوليد تمثيلات قوية للتجميع النصي. التحقيق في الخطاب Reddit على اضطراب ما بعد الصدمة الاضطرابات (PTSD) واضطراب الإجهاد بعد الصدمة المعقدة (C-PTSD)، ونحن نرفض المجموعات المواضيعية التي تمثل المواضيع والسمات الكامنة التي تمت مناقشتها في Subretits R / PTSD و R / CPTSD. علاوة على ذلك، نقدم أيضا تحليلا نوعيا وتوصيف كل كتلة، وكشف مواضيع الخطاب السائدة.
تطبق هذه الورقة نمذجة الموضوع لفهم موضوعات صحة الأم والاهتمامات والأسئلة المعبرين عنها في المجتمعات عبر الإنترنت على مواقع الشبكات الاجتماعية.ندرس تحليل Dirichlet الكامن (LDA) وطريقين حديثين: نموذج موضوع عصبي مع تقطير المعرفة (KD) ونموذج الموضوع المد مج (ETM) على نصوص صحة الأم يتم جمعها من Reddit.يتم تقييم النماذج على جودة موضوع الاستدلال والموضوع، باستخدام مقاييس التقييم التلقائي والتقييم البشري.نحن نحلل قطع اتصال بين المقاييس التلقائية والتقييمات البشرية.في حين أن LDA يؤدي الأفضل بشكل عام مع مقاييس التقييم التلقائي NPMI والتماسك، فإن نموذج الموضوع العصبي مع تقطير المعرفة مواتية من خلال تقييم الخبراء.ونحن أيضا إنشاء خبير جديد جزئيا مشروح موضوع صحة الأم
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا