ترغب بنشر مسار تعليمي؟ اضغط هنا

تبديل السياقات: تدابير النقل من أجل NLP

Switching Contexts: Transportability Measures for NLP

231   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تستكشف هذه الورقة موضوع قابلية النقل، كمنطقة فرعية تتعلق بالتعميم.من خلال اقتراح استخدام المقاييس بناء على إحصاءات راسخة، يمكننا تقدير التغيير في أداء نماذج NLP في سياقات جديدة.قد تسمح تحديد مقياس جديد لقابلية النقل بتقدير أفضل لأداء نظام NLP في مجالات جديدة، وهو أمر بالغ الأهمية عند تقييم أداء أنظمة NLP في مهام ومجال جديدة.من خلال العديد من مثيلات التعقيد المتزايد، نوضح كيف يمكن استخدام تدابير التشابه المجال خفيف الوزن كمقرات لقابلية النقل في تطبيقات NLP.يتم تقييم تدابير النقل المقترحة في سياق التعرف على الكيان المسمى ومهام الاستدلال باللغة الطبيعية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

مشكلة طويلة الأمد مع إعادة صياغة إعادة صياغة هي الافتقار إلى إشارات الإشراف الموثوقة. في هذه الورقة، نقترح نموذجا جديدا غير منشئين من أجل إعادة صياغة إعادة صياغة إعادة صياغة نصها بناء على افتراض أن احتمالات توليد جملتين بنفس المعنى بالنظر إلى نفس الس ياق يجب أن يكون هو نفسه. مستوحاة من هذه الفكرة الأساسية، نقترح نظام خط أنابيب يتكون من إعادة صياغة ترجمة المرشحة بناء على نماذج اللغة السياقية، ومرشح المرشح باستخدام وظائف التسجيل، وإعادة صياغة التدريب النموذجي على أساس المرشحين المحددين. تقدم النموذج المقترح مزايا حول طرق إنشاء الصياغة الحالية: (1) باستخدام السياق العدواني على المعاني، يكون النموذج من إنشاء كميات ضخمة من أزواج إعادة صياغة عالية الجودة؛ (2) مزيج من المبلغ الهائل من المرشحين لإعادة صياغة الصياغة وزيادة ترويج التنوع يتجاوزون الخلاصات مع مزيد من التنوع المعجمي والنزاع؛ و (3) استخدام وظائف تسجيل التخصيب البشرية لتحديد إعادة صياغة أزواج من المرشحين، يوفر الإطار المقترح قناة للمطورين للتدخل مع عملية توليد البيانات، مما يؤدي إلى نموذج أكثر قابلية للتحكم. توضح النتائج التجريبية عبر المهام المختلفة ومجموعات البيانات أن النموذج المقترح تتفوق بشكل كبير على النهج التي يتم إعادة صياغة النصوص الموجودة في كل من الإعدادات الإشرافية وغير المدفوعة.
في هذا البرنامج التعليمي، نهدف إلى إحضار الباحثين المهتمين لبرنامج NLP إلى السرعة حول التقنيات الحديثة والمستمرة لتعلم التمثيل على مستوى المستندات.بالإضافة إلى ذلك، هدفنا هو الكشف عن فرص بحثية جديدة للجمهور، والتي نأمل أن تجلبنانا أقرب إلى معالجة التحديات القائمة في هذا المجال.
يهدف اكتشاف الحدث (ED) إلى تحديد مثيلات الأحداث من الأنواع المحددة في نصوص معينة، والتي تم إضفاء الطابع الرسمي على أنها مهمة تسلسل تسلسل.بقدر ما نعلم، تتخذ نماذج إد القائمة القائم على العصبي القرارات التي تعتمد تماما على الميزات الدلالية السياقية لكل كلمة في النص المدبأ، والتي نجدها من السهل أن تكون من السهل الخلط بين السياقات المتنوعة في مرحلة الاختبار.تحقيقا لهذه الغاية، وصلنا إلى فكرة إدخال مجموعة من الميزات الإحصائية من ترددات حدوث حدث Word-Event في مجموعة التدريب بأكملها للتعاون مع ميزات السياقية.على وجه التحديد، نقترح شبكة تمييزية دلالية وإحصائية مشتركة (SS-JDN) تتكون من مستخرج ميزة دلالية، واستخراج ميزة إحصائية، وتمييز حدث مشترك.في التجارب، يتجاوز SS-JDN بفعالية عشرة خطوط أساسية قوية حديثة على مجموعة بيانات ACE2005 و KBP2015.علاوة على ذلك، نحن نقوم بإجراء تجارب واسعة لتحقيق SS-JDN بشكل شامل.
غالبا ما تعتمد مهام الإجابة على الأسئلة التي تتطلب معلومات من وثائق متعددة على نموذج استرجاع لتحديد المعلومات ذات الصلة للتفكير. يتم تدريب نموذج الاسترجاع عادة على تعظيم احتمالية الأدلة الداعمة المسمى. ومع ذلك، عند الاسترجاع من نصائح نصية كبيرة مثل W ikipedia، غالبا ما يتم الحصول على الإجابة الصحيحة من مرشحين أدلة متعددة. علاوة على ذلك، لا يتم تصنيف جميع هؤلاء المرشحين على أنها إيجابية أثناء التوضيحية، مما يجعل إشارة التدريب ضعيفة وصاخبة. يتم تفاقم هذه المشكلة عندما تكون الأسئلة غير مرضية أو عندما تكون الإجابات منطقية، نظرا لأن النموذج لا يمكن أن يعتمد على التداخل المعجمي لإجراء اتصال بين الإجابة والدليل الدعم. نقوم بتطوير مخففة جديدة لاسترجاع المحدد الذي يتعامل مع الاستعلامات غير المجهولية، ونظهر أن التهميش حول هذه المجموعة أثناء التدريب يسمح للنموذج لتخفيف السلبيات الخاطئة في دعم التعليقات التوضيحية للأدلة. نحن نختبر طريقتنا في مجموعات بيانات QA متعددة الوثائق، IIRC و hotpotqa. على IIRC، نظهر أن النمذجة المشتركة مع التهميش يحسن أداء نموذجي بنسبة 5.5 F1 ونحقق أداء جديد من بين الفنون 50.5 F1. نوضح أيضا أن تهميش استرجاع ينتج عنه تحسن 4.1 ضمير QA F1 على خط الأساس غير المهمش في HOTPOTQA في إعداد FullWiki.
لا يزال توليد القصة الآلي مجالا صعبا للبحث لأنه يفتقر إلى تدابير موضوعية قوية.قد تكون القصص التي تم إنشاؤها صوتا ساحقا، ولكن في كثير من الحالات تعاني من الاتساق السرد السيئ المطلوب لقصة مقنعة وسمعة منطقية.لمعالجة هذا، نقدم فهرسة Fabula Entropy (FEI)، وهي طريقة تقييم لتقييم تماسك القصة من خلال قياس الدرجة التي يتفق عليها المشاركون البشري مع بعضهم البعض عند الإجابة على أسئلة حقيقية / خاطئة حول القصص.ونحن نرتبط بتوبيخ اثنين من التدابير المدرجة النظري من الناحية النظرية للانتروبان الرد على الأسئلة، وإنتروبا من الاتساق العالمي (EWC)، وتركز الانتروبيا من الاتساق الانتقالي (إلخ)، مع التركيز على الاتساق العالمي والمحلي على التوالي.نقيم هذه المقاييس عن طريق اختبارها على قصص مكتوبة بشرية ومقارنة ضد نفس القصص التي كانت تالفة لإدخال الاتجاهات.نظهر أنه في هذه الدراسات التي تسيطر عليها، توفر مؤشرات انتروبيا لدينا مقياسا موضوعيا موثوقا لتماسك القصة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا