ترغب بنشر مسار تعليمي؟ اضغط هنا

الاستفادة من النماذج المحددة للتلخيص التلقائي لمحادثات الطبيب المريض

Leveraging Pretrained Models for Automatic Summarization of Doctor-Patient Conversations

365   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعرض نماذج Resunding Runing Running لتلخيص محادثة محادثة الطبيب تلقائيا العديد من التحديات: بيانات تدريب محدودة، ونقل مجال كبير، والنصوص الطويلة والصعارية، والتقلبات الموجزة عالية الهدف. في هذه الورقة، نستكشف جدوى استخدام نماذج المحولات مسبقا لتلخيص محادثات الطبيب المريض تلقائيا مباشرة من النصوص. نظهر أنه يمكن إنشاء ملخصات بطلاقة وكافية بيانات تدريبية محدودة من قبل BARTING BART على مجموعة بيانات شيدة خصيصا. تتجاوز النماذج الناتجة بشكل كبير أداء Annotator البشري المتوسط ​​ونوعية العمل المنشور السابق للمهمة. نقيم طرق متعددة للتعامل مع المحادثات الطويلة، ومقارنتها إلى خط الأساس الواضح لاقتطاع المحادثة لتناسب حد الطول المحدد مسبقا. نقدم نهجا متعدد المراحل يتناول المهمة من خلال تعلم اثنين من النماذج الدقيقة: واحد لتلخيص قطع المحادثة في ملخصات جزئية، تليها واحدة لإعادة كتابة مجموعة الملخصات الجزئية إلى ملخص كامل. باستخدام مجموعة بيانات ذات ضبط دقيقة تم اختيارها بعناية، تظهر هذه الطريقة فعالة في التعامل مع محادثات أطول، وتحسين جودة الملخصات التي تم إنشاؤها. نقوم بإجراء كل من التقييم التلقائي (من خلال Rouge ومقاييس مقرها المفهوم يركز على النتائج الطبية) وتقييم بشري (من خلال أمثلة نوعية من الأدبيات، تقييم الهلوسة، التعميم، الطلاقة، والنوعية العامة للملخصات التي تم إنشاؤها).



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نركز على نماذج الحوار في سياق الدراسات السريرية حيث الهدف هو المساعدة في جمع، بالإضافة إلى المعلومات الوثيقة التي تم جمعها بناء على استبيان معلومات صريحة ذات صلة طبيا.لتعزيز مشاركة المستخدم وعنوان هذا الهدف المزدوج (جمع مجموعة من نقاط البيانات ال محددة مسبقا ومعلومات غير رسمية حول حالة المرضى)، نقدم نموذج فرعي مصنوع من ثلاثة برادات: قائمة على المهام ومتابعة وبوت اجتماعي.نقدم طريقة عامة لتطوير روبوتات المتابعة.نحن نقارن تكوينات الفرقة المختلفة ونؤثر أن مزيج من الروبوتات الثلاثة (I) يوفر أساسا أفضل لجمع المعلومات من مجرد المعلومات التي تبحث عن الروبوت و (2) بجمع المعلومات بطريقة أكثر سهولة الاستخدام بطريقة أكثر فاعلية بحيث تكون فرقةنموذج يجمع بين المعلومات التي تبحث عنها والروبوت الاجتماعي.
نماذج اللغة واسعة النطاق مثل GPT-3 هي متعلمين بقلة قليلة، مما يتيح لهم السيطرة عليها عبر مطالبات النص الطبيعي. أبلغ الدراسات الحديثة أن التصنيف المباشر الفوري يزيل الحاجة إلى ضبط الدقيقة ولكن يفتقر إلى إمكانية التوسع للبيانات والاستدلال. تقترح هذه ال ورقة تقنية تكبير بيانات جديدة ترفع نماذج لغة واسعة النطاق لتوليد عينات نصية واقعية من مزيج من العينات الحقيقية. نقترح أيضا استخدام الملصقات الناعمة المتوقعة من النماذج اللغوية، وتقطير المعرفة بفعالية من نماذج اللغة واسعة النطاق وإنشاء اضطرابات نصية في وقت واحد. نقوم بإجراء تجارب تكبير البيانات على مهام التصنيف المتنوعة وإظهار أن طريقتنا تتفوق بشكل كبير على أساليب تكبير النص الحالية. نقوم أيضا بإجراء تجارب في معيارنا المقترح حديثا لإظهار أن تأثير تكبير لا يعزى فقط إلى الحفظ. مزيد من دراسات الاجتثاث والتحليل النوعي توفر المزيد من الأفكار في نهجنا.
سلامة المريض هو مفهوم حديث لكن ليس بجديد في أنظمة الرعاية الصحية العالمية حيث تؤكد التقارير والتحاليل أن الأخطاء الطبية تؤدي إلى حوادث صحية معاكسة وضارة وفي بعض الأحيان وخيمة (Adverse Events & Reactions). ومع العلم بأن موضوع السلامة في أي مؤسسة صحية هي معيار بحد ذاته وحق من حقوق المريض، إلا أن أهمية تفادي حوادث المرضى المعاكسة لم تكن معروفة ومُدْرَكَة حتى عام 1990م، وذلك عندما أظهرت أعداد مذهلة من التقارير الاحصائية لبلدان متعددة أن أذيات المرضى ووفياتهم كانت قد حدثت بسبب الأخطاء الطبية والتمريضية وعلى مستوى العالم، حيث شقّت هذه الاحصائيات طريقها الى العلن من خلال أشهر تقرير احصائي أعدّه المعهد الطبي IOM (Institute Of Medicine) ونشره عام 1990م، بعنوان "To err is human, Kohn, Corrigan & Donaldson, 1990" أي "أن تخطئ فذلك لأنك انسان"، وكانت أهم توصيات المعهد الطبي من خلاله التأكيد على ضرورة تبني معايير ممارسة وأداء مركزة بشكل أكبر على السلامة (سلامة المرضى).
استخدام البيانات من اختبارات المرنة الإنجليزية، والتي أبلغت فيها المواضيع ذاتها الذاتي عن جنسهن وعمرها والتعليم والعرق، ندرس اختلافات الأداء في نماذج اللغة المحددة مسبقا عبر المجموعات الديموغرافية، والتي تحددها هذه الصفات (المحمية).نوضح ثغرات أداء وا سعة عبر الفئات الديموغرافية وإظهار أن نماذج اللغة المسبقة مسبقا تكافح المتحدثين ذكور الشباب غير الأبيض؛على سبيل المثال، لا تعلم نماذج اللغة المحددة مسبقا تعلم التحيزات الاجتماعية (الجمعيات النمطية) - تعلم النماذج اللغوية المحددة أيضا التحيزات الاجتماعية، وتعلم التحدث أكثر شيئين أكثر من مثل الآخرين.ومع ذلك، نوضح أنه، باستثناء نماذج بيرت، تخفض نماذج اللغة الأكبر المحددة مسبقا بعض فجوات الأداء بين الأغلبية والأقليات.
تركز العمل الحالي على التحقيق في نماذج اللغة المحددة مسبقا (LMS) في الغالب على المهام الأساسية على مستوى الجملة.في هذه الورقة، نقدم إجراء خطاب على مستوى المستندات لتقييم قدرة LMS المسبقة على التقاط العلاقات على مستوى المستندات.نقوم بتجربة 7 LMS محددة مسبقا، 4 لغات، و 7 مهام قيد الخطاب، والعثور على بارت ليكون بشكل عام أفضل نموذج في التقاط الخطاب - - ولكن فقط في تشفيرها، مع بيرت أداء بشكل مفاجئ نموذج الأساس.عبر النماذج المختلفة، هناك اختلافات كبيرة في أفضل طبقات في التقاط معلومات خطاب، والتفاوتات الكبيرة بين النماذج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا