تستكشف هذه الورقة موضوع قابلية النقل، كمنطقة فرعية تتعلق بالتعميم.من خلال اقتراح استخدام المقاييس بناء على إحصاءات راسخة، يمكننا تقدير التغيير في أداء نماذج NLP في سياقات جديدة.قد تسمح تحديد مقياس جديد لقابلية النقل بتقدير أفضل لأداء نظام NLP في مجالات جديدة، وهو أمر بالغ الأهمية عند تقييم أداء أنظمة NLP في مهام ومجال جديدة.من خلال العديد من مثيلات التعقيد المتزايد، نوضح كيف يمكن استخدام تدابير التشابه المجال خفيف الوزن كمقرات لقابلية النقل في تطبيقات NLP.يتم تقييم تدابير النقل المقترحة في سياق التعرف على الكيان المسمى ومهام الاستدلال باللغة الطبيعية.
This paper explores the topic of transportability, as a sub-area of generalisability. By proposing the utilisation of metrics based on well-established statistics, we are able to estimate the change in performance of NLP models in new contexts. Defining a new measure for transportability may allow for better estimation of NLP system performance in new domains, and is crucial when assessing the performance of NLP systems in new tasks and domains. Through several instances of increasing complexity, we demonstrate how lightweight domain similarity measures can be used as estimators for the transportability in NLP applications. The proposed transportability measures are evaluated in the context of Named Entity Recognition and Natural Language Inference tasks.
المراجع المستخدمة
https://aclanthology.org/
مشكلة طويلة الأمد مع إعادة صياغة إعادة صياغة هي الافتقار إلى إشارات الإشراف الموثوقة. في هذه الورقة، نقترح نموذجا جديدا غير منشئين من أجل إعادة صياغة إعادة صياغة إعادة صياغة نصها بناء على افتراض أن احتمالات توليد جملتين بنفس المعنى بالنظر إلى نفس الس
في هذا البرنامج التعليمي، نهدف إلى إحضار الباحثين المهتمين لبرنامج NLP إلى السرعة حول التقنيات الحديثة والمستمرة لتعلم التمثيل على مستوى المستندات.بالإضافة إلى ذلك، هدفنا هو الكشف عن فرص بحثية جديدة للجمهور، والتي نأمل أن تجلبنانا أقرب إلى معالجة التحديات القائمة في هذا المجال.
يهدف اكتشاف الحدث (ED) إلى تحديد مثيلات الأحداث من الأنواع المحددة في نصوص معينة، والتي تم إضفاء الطابع الرسمي على أنها مهمة تسلسل تسلسل.بقدر ما نعلم، تتخذ نماذج إد القائمة القائم على العصبي القرارات التي تعتمد تماما على الميزات الدلالية السياقية لكل
غالبا ما تعتمد مهام الإجابة على الأسئلة التي تتطلب معلومات من وثائق متعددة على نموذج استرجاع لتحديد المعلومات ذات الصلة للتفكير. يتم تدريب نموذج الاسترجاع عادة على تعظيم احتمالية الأدلة الداعمة المسمى. ومع ذلك، عند الاسترجاع من نصائح نصية كبيرة مثل W
لا يزال توليد القصة الآلي مجالا صعبا للبحث لأنه يفتقر إلى تدابير موضوعية قوية.قد تكون القصص التي تم إنشاؤها صوتا ساحقا، ولكن في كثير من الحالات تعاني من الاتساق السرد السيئ المطلوب لقصة مقنعة وسمعة منطقية.لمعالجة هذا، نقدم فهرسة Fabula Entropy (FEI)،