ترغب بنشر مسار تعليمي؟ اضغط هنا

اكتشاف أساسيات نموذج أفضل لفهم الاستعلام الطبي

Discovering Better Model Architectures for Medical Query Understanding

540   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في تطوير نظام لإجواب الأسئلة عبر الإنترنت للنطاقات الطبية، تلعب نماذج الاستدلال باللغة الطبيعية (NLI) دورا رئيسيا في مطابقة الأسئلة والكشف عن النية.ومع ذلك، ما هي النماذج هي الأفضل لمجموعات البيانات لدينا؟اختيار أو ضبط نموذج يدويا هو تستغرق وقتا طويلا.وبالتالي، نقوم بتجربة تحسين هياكل النموذج تلقائيا على المهمة في متناول اليد عبر بحث العمارة العصبية (NAS).أولا، نقوم بصياغة مساحة بحث عن الهندسة المعمارية الجديدة تعتمد على أدب NAS السابق، ودعم النمذجة الانتباه عبر الجملة (Cross-Attn).ثانيا، نقترح تعديل طريقة ENAS لتسريع وتحقيق الاستقرار في نتائج البحث.نقوم بإجراء تجارب واسعة النطاق على مهامنا NLI الطبية.تظهر النتائج أن نظامنا يمكن أن يتفوق بسهولة على نماذج الأساس الكلاسيكية.نقارن أساليب NAS المختلفة وإظهار نهجنا يوفر أفضل النتائج.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أصبحت الرعاية الصحية موضوع بحث أكثر وأكثر أهمية مؤخرا. مع البيانات المتنامية في مجال الرعاية الصحية، فإنه يوفر فرصة رائعة للتعلم العميق لتحسين جودة الخدمة وتقليل التكاليف. ومع ذلك، فإن تعقيد بيانات السجلات الصحية الإلكترونية (EHR) هي تحديا لتطبيق الت علم العميق. على وجه التحديد، تتم مراقبة البيانات التي تم إنتاجها في القبول في المستشفى من قبل نظام EHR، والذي يتضمن بيانات منظمة مثل درجة حرارة الجسم اليومية والبيانات غير المنظمة مثل النصوص المجانية والقياسات المختبرية. على الرغم من وجود بعض الأطر المعالجة المسبقة المقترحة لبيانات EHR المحددة، فإن الملاحظات السريرية التي تحتوي على قيمة سريرية كبيرة تتجاوز عالم نظرها. بالإضافة إلى ذلك، سواء كانت هذه البيانات المختلفة من وجهات النظر المختلفة هي مفيدة لجميع المهام الطبية وكيفية الاستفادة من أفضل هذه البيانات لا تزال غير واضحة. لذلك، في هذه الورقة، نقوم أولا باستخراج الملاحظات السريرية المصاحبة من EHR وتقترح طريقة لدمج هذه البيانات، كما ندرس بشكل شامل النماذج المختلفة وأساليب نفاد البيانات لتحسين أداء تنبؤ المهام الطبي بشكل أفضل. تظهر النتائج على مهام التنبؤتين أن نموذجنا المنصوص عليه مع بيانات مختلفة تتفوق على الطريقة التي من أحدثها دون ملاحظات سريرية، توضح أهمية طريقة الانصهار وميزات الملاحظات السريرية.
يقترح إعادة كتابة الاستعلام (QR) حل مشكلة عدم تطابق الكلمة بين الاستفسارات والمستندات في البحث على الويب. الأساليب الحالية عادة ما نموذج QR مع نموذج تسلسل نهاية إلى نهاية (SEQ2SEQ). يمكن أن تتعلم النماذج القائمة على المحولات الحديثة بفعالية دلالات نص ية من سجلات جلسة المستخدم، لكنها غالبا ما تتجاهل معلومات الموقع الجغرافي للمستخدمين الحيوية لتحقيق البحث عن نقطة الفائدة (POI) على خدمات الخريطة. في هذه الورقة، اقترحنا نموذجا ما قبل التدريب، يسمى GEO-BERT، لدمج الدلالات والمعلومات الجغرافية في التمثيلات المدربة مسبقا للويس. أولا، نحاكي توزيع POI في العالم الحقيقي كشركة رسم بياني، حيث تمثل العقد Pois ومتعدد الحبيبات الجغرافية. ثم نستخدم أساليب تعلم التمثيل الرسم البياني للحصول على تمثيلات جغرافية. أخيرا، نحن ندرب نموذجا ما قبل التدريب يشبه بيرت مع تضيير الرسوم البيانية النصية والنصية للحصول على تمثيل متكامل لكل من المعلومات الجغرافية والدلية، وتطبيقه في البحث عن QR of POI. يحقق النموذج المقترح دقة ممتازة على مجموعة واسعة من مجموعات بيانات خريطة العالم الواقعية.
في هذه الورقة، نقترح تعريف وتعريفي من أنواع مختلفة من المحتوى النصي غير القياسي - يشار إليها عموما باسم الضوضاء "- في معالجة اللغة الطبيعية (NLP). في حين أن معالجة البيانات المسبقة هي بلا شك مهم بلا شك في NLP، خاصة عند التعامل مع المحتوى الذي تم إنشا ؤه من قبل المستخدم، فإن فهم أوسع لمصادر الضوضاء المختلفة وكيفية التعامل معها هو جانب تم إهماله إلى حد كبير. نحن نقدم قائمة شاملة للمصادر المحتملة للضوضاء، وتصنيفها ووصفها، وتظهر تأثير مجموعة فرعية من استراتيجيات المعالجة القياسية المعدلة على مهام مختلفة. هدفنا الرئيسي هو زيادة الوعي بالمحتوى غير المعتاد - والذي لا ينبغي اعتباره دائما ضوضاء "- والحاجة إلى المعالجة المسبقة التي تعتمد على المهام. هذا بديل إلى بطانية، مثل الحلول الشاملة التي تطبقها الباحثون بشكل عام من خلال "خطوط أنابيب معالجة مسبقا مسبقا". النية هي لهذا التصنيف بمثابة نقطة مرجعية لدعم الباحثين NLP في وضع الاستراتيجيات لتنظيف أو تطبيع أو احتضان المحتوى غير المعتاد.
أظهرت نماذج اللغة الموجودة مسبقا مسبقا (PLMS) فعالية التعلم الإشراف على الذات لمجموعة واسعة من مهام معالجة اللغة الطبيعية (NLP). ومع ذلك، فإن معظمهم لا يدركون بشكل صريح المعرفة الخاصة بالمجال، وهو أمر ضروري لمهام المصب في العديد من المجالات، مثل المه ام في سيناريوهات التجارة الإلكترونية. في هذه الورقة، نقترح K- المكونات، نموذج لغة محقوم المعرفة مسبقا بناء على محول تشفير التشفير التي يمكن تحويلها إلى كل من فهم اللغة الطبيعية ومهام الجيل. على وجه التحديد، نقترح خمسة أهداف مسبقة الإشراف على علم المعرفة على المعرفة في تصميم تعلم المعرفة الخاصة بالمجال، بما في ذلك قواعد المعرفة الخاصة بالمجال التجاري، وجوانب كيانات المنتج، وفئات من كيانات المنتجات، ومقترحات البيع الفريدة من كيانات المنتج. نتحقق من طريقتنا في مجموعة متنوعة من سيناريوهات التجارة الإلكترونية التي تتطلب معرفة خاصة بالمجال، بما في ذلك إكمال قاعدة معارف المنتج، وخصم منتج مبيعات، والحوار متعدد الدوران. تتفوق K- التوصيل بشكل كبير على خطوط الأساس في جميع المجالات، والتي توضح أن الطريقة المقترحة تتعلم بفعالية مجموعة متنوعة متنوعة من المعرفة الخاصة بالمجال لكل من مهام الفم والجيل اللغوي. رمز لدينا متاح.
يعرض عدم وجود بيانات تدريبية تحديا كبيرا لتحجيم فهم اللغة المنطوقة لغات الموارد المنخفضة.على الرغم من أن نهج تكبير البيانات المختلفة قد اقترحت توليف البيانات التدريبية في لغات مستهدفة منخفضة الموارد، فإن مجموعات البيانات المعززة غالبا ما تكون صاخبة، وبالتالي تعيق أداء نماذج SLU.في هذه الورقة نركز على تخفيف الضوضاء في البيانات المعززة.نقوم بتطوير نهج تدريب Denosising.يتم تدريب نماذج متعددة مع البيانات التي تنتجها الطرق المعززة المختلفة.توفر هذه النماذج إشارات الإشراف لبعضها البعض.تظهر النتائج التجريبية أن أسلوبنا تتفوق على الحالة القائمة من الفن الموجودة بمقدار 3.05 و 4.24 نقطة مئوية عن مجموعات بيانات قياسية على التوالي.سيتم تقديم الرمز مفتوح المصادر على جيثب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا