في تطوير نظام لإجواب الأسئلة عبر الإنترنت للنطاقات الطبية، تلعب نماذج الاستدلال باللغة الطبيعية (NLI) دورا رئيسيا في مطابقة الأسئلة والكشف عن النية.ومع ذلك، ما هي النماذج هي الأفضل لمجموعات البيانات لدينا؟اختيار أو ضبط نموذج يدويا هو تستغرق وقتا طويلا.وبالتالي، نقوم بتجربة تحسين هياكل النموذج تلقائيا على المهمة في متناول اليد عبر بحث العمارة العصبية (NAS).أولا، نقوم بصياغة مساحة بحث عن الهندسة المعمارية الجديدة تعتمد على أدب NAS السابق، ودعم النمذجة الانتباه عبر الجملة (Cross-Attn).ثانيا، نقترح تعديل طريقة ENAS لتسريع وتحقيق الاستقرار في نتائج البحث.نقوم بإجراء تجارب واسعة النطاق على مهامنا NLI الطبية.تظهر النتائج أن نظامنا يمكن أن يتفوق بسهولة على نماذج الأساس الكلاسيكية.نقارن أساليب NAS المختلفة وإظهار نهجنا يوفر أفضل النتائج.
In developing an online question-answering system for the medical domains, natural language inference (NLI) models play a central role in question matching and intention detection. However, which models are best for our datasets? Manually selecting or tuning a model is time-consuming. Thus we experiment with automatically optimizing the model architectures on the task at hand via neural architecture search (NAS). First, we formulate a novel architecture search space based on the previous NAS literature, supporting cross-sentence attention (cross-attn) modeling. Second, we propose to modify the ENAS method to accelerate and stabilize the search results. We conduct extensive experiments on our two medical NLI tasks. Results show that our system can easily outperform the classical baseline models. We compare different NAS methods and demonstrate our approach provides the best results.
المراجع المستخدمة
https://aclanthology.org/
أصبحت الرعاية الصحية موضوع بحث أكثر وأكثر أهمية مؤخرا. مع البيانات المتنامية في مجال الرعاية الصحية، فإنه يوفر فرصة رائعة للتعلم العميق لتحسين جودة الخدمة وتقليل التكاليف. ومع ذلك، فإن تعقيد بيانات السجلات الصحية الإلكترونية (EHR) هي تحديا لتطبيق الت
يقترح إعادة كتابة الاستعلام (QR) حل مشكلة عدم تطابق الكلمة بين الاستفسارات والمستندات في البحث على الويب. الأساليب الحالية عادة ما نموذج QR مع نموذج تسلسل نهاية إلى نهاية (SEQ2SEQ). يمكن أن تتعلم النماذج القائمة على المحولات الحديثة بفعالية دلالات نص
في هذه الورقة، نقترح تعريف وتعريفي من أنواع مختلفة من المحتوى النصي غير القياسي - يشار إليها عموما باسم الضوضاء "- في معالجة اللغة الطبيعية (NLP). في حين أن معالجة البيانات المسبقة هي بلا شك مهم بلا شك في NLP، خاصة عند التعامل مع المحتوى الذي تم إنشا
أظهرت نماذج اللغة الموجودة مسبقا مسبقا (PLMS) فعالية التعلم الإشراف على الذات لمجموعة واسعة من مهام معالجة اللغة الطبيعية (NLP). ومع ذلك، فإن معظمهم لا يدركون بشكل صريح المعرفة الخاصة بالمجال، وهو أمر ضروري لمهام المصب في العديد من المجالات، مثل المه
يعرض عدم وجود بيانات تدريبية تحديا كبيرا لتحجيم فهم اللغة المنطوقة لغات الموارد المنخفضة.على الرغم من أن نهج تكبير البيانات المختلفة قد اقترحت توليف البيانات التدريبية في لغات مستهدفة منخفضة الموارد، فإن مجموعات البيانات المعززة غالبا ما تكون صاخبة،