ترغب بنشر مسار تعليمي؟ اضغط هنا

إعادة النظر في تصنيف علاقات قليلة: بيانات التقييم وإخطط التصنيف

Revisiting Few-shot Relation Classification: Evaluation Data and Classification Schemes

566   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نستكشف عدد قليل من التعلم (FSL) لتصنيف العلاقة (RC).مع التركيز على السيناريو الواقعي من FSL، والتي قد لا تنتمي مثيل الاختبار إلى أي من الفئات المستهدفة (لا شيء أعلاه، [nota])، فإننا أولا إعادة النظر في هيكل مجموعة البيانات الشعبية الأخيرة ل FSL، مشيرا إليهاتوزيع البيانات غير واقعية.لعلاج هذا، نقترح منهجية جديدة لاستكشاف بيانات اختبار القليل من الطوائم بشكل أكثر واقعية من مجموعات البيانات المتوفرة ل RC الإشراف، وتطبيقها على مجموعة البيانات المشبوكة.هذا ينتج معيارا صعبا جديدا ل FSL-RC، في أي حالة من النماذج الفنية تظهر أداء ضعيف.بعد ذلك، نقوم بتحليل مخططات التصنيف ضمن النهج الأقرب القائم على الإرشاد القائم على التضمين FSL، فيما يتعلق بالقيود التي يفرضونها على مساحة التضمين.الناجمة عن هذا التحليل، نقترح مخطط تصنيف جديد يتمثل فيه فئة NOTA كأداة مستفادة، مبين تجريبي ليكون خيارا جذابا ل FSL.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يمكن للبشر التمييز بين فئات جديدة بكفاءة للغاية مع عدد قليل من الأمثلة، إلى حد كبير بسبب حقيقة أن البشر يمكنهم الاستفادة من المعرفة التي تم الحصول عليها من المهام ذات الصلة.ومع ذلك، يميل نموذج تصنيف النص في التعلم العميق إلى الكفاح لتحقيق أداء مرض عن دما تكون البيانات المسمى نادرة.مستوحاة من الذكاء البشري، نقترح تقديم المعرفة الخارجية إلى سلطة قليلة التعلم لتقليد المعرفة الإنسانية.يتم التحقيق في شبكة مولدات المعلمة الرواية بهذا الغاية، والتي تتمكن من استخدام المعرفة الخارجية لتوليد مقاييس مختلفة لمهام مختلفة.المسلحة مع هذه الشبكة، يمكن لمهام مماثلة استخدام مقاييس مماثلة في حين تستخدم المهام المختلفة مقاييس مختلفة.من خلال التجارب، نوضح أن أسلوبنا تتفوق على نماذج تصنيف النص القليلة لقلة سوتا.
ينشأ التعلم القليل من الرصاص في سيناريوهات عملية مهمة، كما هو الحال عندما يحتاج نظام فهم اللغة الطبيعية إلى تعلم ملصقات دلالية جديدة للنشاط الناشئ والموارد النادر. في هذه الورقة، نستكشف الأساليب القائمة على استرجاع مهام تعبئة النوايا وملء الفتحات في إعدادات قليلة. تتكبد الأساليب المستندة إلى الاسترداد تنبؤات بناء على الأمثلة المسمى في مؤشر الاسترجاع مماثلة للمدخلات، وبالتالي يمكن أن تتكيف مع مجالات جديدة ببساطة عن طريق تغيير الفهرس دون الحاجة إلى إعادة تدريب النموذج. ومع ذلك، فمن غير تافهة لتطبيق هذه الأساليب على المهام مع مساحة تسمية معقدة مثل ملء الفتحة. تحقيقا لهذه الغاية، نقترح طريقة استرجاع مدفوعة المستوى التي تتعلم تمثيلات محكسية مماثلة للتمثيل مع نفس التسمية عبر هدف Softmax Batch-Softmax الرواية. في وقت الاستدلال، نستخدم ملصقات المسافات المستردة لبناء الهيكل النهائي بأعلى درجة التجميع. تتفوق طريقةنا على الأنظمة السابقة في مختلف إعدادات القليل من الطوائم على معايير Clinc and Senips.
إن تطبيق تقنيات الترميز التنبؤية للنصوص القانونية لديه القدرة على تقليل تكلفة المراجعة القانونية للوثائق، ومع ذلك، هناك مثل هذه المجموعة الواسعة من المهام القانونية والتشريعات المتطورة باستمرار من الصعب بناء بيانات تدريبية كافية لتغطية جميعهاحالات.في هذه الورقة، نقوم بالتحقيق في طرق قليلة من الأساطير والرصاص التي تتطلب بيانات تدريب أقل بكثير وإدخال هندسة ثلاثية، والتي تنتج البيانات الإذنية أداء قريبة من نظام نظام إشرافي.تسمح هذه الطريقة بطرق ترميز التنبؤ أن يتم تطويرها بسرعة للوائح والأسواق الجديدة.
نقترح محدب (مستخرج قيمة المحادثة)، وهو نهج عصبي فعال وضبط ناعم لمهام مربع حوار وضع العلامات. بدلا من الاعتماد على أهداف محتملة أكثر عمليا من العمل السابق (مثل النمذجة، ونمذجة اللغة، واختيار الاستجابة)، فإن مهمة محدبة محدبة، وهي مهمة عبء الزوجية الزوج ية باستخدام بيانات Reddit، تتماشى بشكل جيد مع استخدامها المقصود على مهام وضع التسلسل. وهذا يتيح تعلم معدلات الفتحات الخاصة بالمجال الخاصة بالمجال بمجرد ضبط طبقات فك تشفير طبقات تسلسل التسلسل العام للأغراض العامة، في حين يتم الاحتفاظ غالبية معلمات النموذج مسبقا المجمدة. نقوم بالإبلاغ عن أداء محدب الحديثة عبر مجموعة من المجالات المتنوعة ومجموعات البيانات لوضع علامات على فتحة الحوار، مع أكبر المكاسب في أكثر الإعدادات الصعبة والعديد من الرصاص. نعتقد أن أوقات محدبة المحدبة المختصرة (أي، فقط 18 ساعة على 12 GPUs) والتكلفة، إلى جانب ضبطها الدقيقة الفعالة وأدائها القوي، وعدت إمكانية النقل والأوسع نطاقا وتوسيع نطاق مهام وضع التسلسل الموفرة للبيانات بشكل عام.
يركز استخراج علاقات قليلة (FSRE) على الاعتراف بعلاقات جديدة من خلال التعلم مع مجرد حفنة من الحالات المشروح.تم اعتماد التعلم التلوي على نطاق واسع لمثل هذه المهمة، والتي تتدرب على إنشاء مهام قليلة من الرصاص بشكل عشوائي لتعلم تمثيلات بيانات عامة.على الر غم من النتائج المثيرة للإعجاب التي تحققت، لا تزال النماذج الحالية تؤدي دون التفاادم عند التعامل مع مهام FSRE الثابتة، حيث تكون العلاقات محببة ومتشابهة لبعضها البعض.نقول هذا إلى حد كبير لأن النماذج الحالية لا تميز المهام الثابتة من سهلة في عملية التعلم.في هذه الورقة، نقدم نهجا جديدا يعتمد على التعلم المتعاقل الذي يتعلم تمثيلات أفضل من خلال استغلال معلومات الملصقات العلاقة.نحن أيضا تصميم طريقة تسمح للنموذج بتعلم تكيف كيفية التركيز على المهام الثابتة.تجارب على مجموعة بيانات قياسية توضح فعالية طريقتنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا