نستكشف عدد قليل من التعلم (FSL) لتصنيف العلاقة (RC).مع التركيز على السيناريو الواقعي من FSL، والتي قد لا تنتمي مثيل الاختبار إلى أي من الفئات المستهدفة (لا شيء أعلاه، [nota])، فإننا أولا إعادة النظر في هيكل مجموعة البيانات الشعبية الأخيرة ل FSL، مشيرا إليهاتوزيع البيانات غير واقعية.لعلاج هذا، نقترح منهجية جديدة لاستكشاف بيانات اختبار القليل من الطوائم بشكل أكثر واقعية من مجموعات البيانات المتوفرة ل RC الإشراف، وتطبيقها على مجموعة البيانات المشبوكة.هذا ينتج معيارا صعبا جديدا ل FSL-RC، في أي حالة من النماذج الفنية تظهر أداء ضعيف.بعد ذلك، نقوم بتحليل مخططات التصنيف ضمن النهج الأقرب القائم على الإرشاد القائم على التضمين FSL، فيما يتعلق بالقيود التي يفرضونها على مساحة التضمين.الناجمة عن هذا التحليل، نقترح مخطط تصنيف جديد يتمثل فيه فئة NOTA كأداة مستفادة، مبين تجريبي ليكون خيارا جذابا ل FSL.
We explore few-shot learning (FSL) for relation classification (RC). Focusing on the realistic scenario of FSL, in which a test instance might not belong to any of the target categories (none-of-the-above, [NOTA]), we first revisit the recent popular dataset structure for FSL, pointing out its unrealistic data distribution. To remedy this, we propose a novel methodology for deriving more realistic few-shot test data from available datasets for supervised RC, and apply it to the TACRED dataset. This yields a new challenging benchmark for FSL-RC, on which state of the art models show poor performance. Next, we analyze classification schemes within the popular embedding-based nearest-neighbor approach for FSL, with respect to constraints they impose on the embedding space. Triggered by this analysis, we propose a novel classification scheme in which the NOTA category is represented as learned vectors, shown empirically to be an appealing option for FSL.
المراجع المستخدمة
https://aclanthology.org/
يمكن للبشر التمييز بين فئات جديدة بكفاءة للغاية مع عدد قليل من الأمثلة، إلى حد كبير بسبب حقيقة أن البشر يمكنهم الاستفادة من المعرفة التي تم الحصول عليها من المهام ذات الصلة.ومع ذلك، يميل نموذج تصنيف النص في التعلم العميق إلى الكفاح لتحقيق أداء مرض عن
ينشأ التعلم القليل من الرصاص في سيناريوهات عملية مهمة، كما هو الحال عندما يحتاج نظام فهم اللغة الطبيعية إلى تعلم ملصقات دلالية جديدة للنشاط الناشئ والموارد النادر. في هذه الورقة، نستكشف الأساليب القائمة على استرجاع مهام تعبئة النوايا وملء الفتحات في
إن تطبيق تقنيات الترميز التنبؤية للنصوص القانونية لديه القدرة على تقليل تكلفة المراجعة القانونية للوثائق، ومع ذلك، هناك مثل هذه المجموعة الواسعة من المهام القانونية والتشريعات المتطورة باستمرار من الصعب بناء بيانات تدريبية كافية لتغطية جميعهاحالات.في
نقترح محدب (مستخرج قيمة المحادثة)، وهو نهج عصبي فعال وضبط ناعم لمهام مربع حوار وضع العلامات. بدلا من الاعتماد على أهداف محتملة أكثر عمليا من العمل السابق (مثل النمذجة، ونمذجة اللغة، واختيار الاستجابة)، فإن مهمة محدبة محدبة، وهي مهمة عبء الزوجية الزوج
يركز استخراج علاقات قليلة (FSRE) على الاعتراف بعلاقات جديدة من خلال التعلم مع مجرد حفنة من الحالات المشروح.تم اعتماد التعلم التلوي على نطاق واسع لمثل هذه المهمة، والتي تتدرب على إنشاء مهام قليلة من الرصاص بشكل عشوائي لتعلم تمثيلات بيانات عامة.على الر