ترغب بنشر مسار تعليمي؟ اضغط هنا

العسل أو السم؟حل لعنة المشغل في الكشف عن الحدث قليلة عبر التدخل السببي

Honey or Poison? Solving the Trigger Curse in Few-shot Event Detection via Causal Intervention

437   0   2   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تأثرت الكشف عن الحدث منذ فترة طويلة بسبب لعنة الزناد: التجاوز الزنجي سيضر بالقدرة على مستوى التعميم أثناء تقديره سيضر بأداء الكشف.هذه المشكلة أكثر حدة في سيناريو أقل لقطة.في هذه الورقة، نحدد وحل مشكلة لعنة المشغل في اكتشاف حدث قليل الطواف (FSED) من وجهة نظر سببية.من خلال صياغة FSED مع نموذج سببي هيكلي (SCM)، وجدنا أن الزناد هو مواجهة السياق والنتيجة، مما يجعل أساليب FSED السابقة أسهل بكثير على المشغلات المبكرة.لحل هذه المشكلة، نقترح التدخل في السياق عن طريق تعديل الخلفية أثناء التدريب.تبين التجارب أن طريقتنا تحسن بشكل كبير من FSED على كل من مجموعة بيانات ACE05 و Maven.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نتطلع إلى تحيز أخذ العينات والقضايا الخارجية في عدد قليل من التعلم عن اكتشاف الحدث، وهو متعقب فرعي لاستخراج المعلومات.نقترح نموذج العلاقات بين المهام التدريبية في التعلم القليل من الرصاص البارز من خلال إدخال نماذج النماذج عبر المهام.ونحن نقترح كذ لك فرض اتساق التنبؤ بين المصنفين عبر المهام لجعل النموذج أكثر قوة على القيم المتطرفة.تظهر تجربتنا الواسعة تحسنا ثابتا على ثلاث مجموعات من مجموعات بيانات التعلم قليلة.تشير النتائج إلى أن نموذجنا هو أكثر قوة عند وصف بيانات المسمى لأنواع الأحداث الرواية محدودة.يتوفر شفرة المصدر على http://github.com/laiviet/fsl-proact.
في هذا العمل، نركز على سيناريو عددا أقل تحديا للكشف عن قلة الرصاص حيث يكون العديد من النوايا المحبوسة بشكل جيد ومشبه بشكل صحيح.نقدم مخطط اكتشاف عديدي بسيطة ولكنه فعالة من القلة عبر التدريب المسبق والضبط الناعم الصنع.على وجه التحديد، نقوم أولا بإجراء تدريبات مسبقة من الناحية التي تم إشرافها ذاتيا على مجموعات بيانات النية التي تم جمعها، والتي تتعلم ضمنيا التمييز بين الكلام المماثلة الدلوية دون استخدام أي ملصقات.ثم نقوم بعد ذلك بإجراء اكتشاف عهد القليل من الرصاص مع التعلم البسيط المشروع، والذي يسحب صراحة النطق من نفس النية أقرب ويغطي الكلام عبر النوايا المختلفة أبعد.تظهر النتائج التجريبية أن أسلوبنا المقترح يحقق أداء حديثة على ثلاثة مجموعات بيانات للكشف عن النوايا الصعبة تحت 5 لقطة و 10 لقطة.
يهدف اكتشاف الحدث (ED) إلى تحديد مثيلات الأحداث من الأنواع المحددة في نصوص معينة، والتي تم إضفاء الطابع الرسمي على أنها مهمة تسلسل تسلسل.بقدر ما نعلم، تتخذ نماذج إد القائمة القائم على العصبي القرارات التي تعتمد تماما على الميزات الدلالية السياقية لكل كلمة في النص المدبأ، والتي نجدها من السهل أن تكون من السهل الخلط بين السياقات المتنوعة في مرحلة الاختبار.تحقيقا لهذه الغاية، وصلنا إلى فكرة إدخال مجموعة من الميزات الإحصائية من ترددات حدوث حدث Word-Event في مجموعة التدريب بأكملها للتعاون مع ميزات السياقية.على وجه التحديد، نقترح شبكة تمييزية دلالية وإحصائية مشتركة (SS-JDN) تتكون من مستخرج ميزة دلالية، واستخراج ميزة إحصائية، وتمييز حدث مشترك.في التجارب، يتجاوز SS-JDN بفعالية عشرة خطوط أساسية قوية حديثة على مجموعة بيانات ACE2005 و KBP2015.علاوة على ذلك، نحن نقوم بإجراء تجارب واسعة لتحقيق SS-JDN بشكل شامل.
تهدف مهمة اكتشاف الحدث (ED) في استخراج المعلومات إلى الاعتراف وتصنيف كلمات الأحداث في النص. تميز التقدم الأخير نماذج لغوية متقدمة للمحولات المتقدمة (على سبيل المثال، بيرت) كعنصر حاسم في النماذج الحديثة للإد. ومع ذلك، فإن الحد الطول لنصوص الإدخال هو ح اجز لمثل هذه النماذج المحددة لأنها لا تستطيع تشفير سياق مستوي المستند طويل المدى الذي ثبت أنه مفيد لإد إد. لمعالجة هذه المشكلة، نقترح طريقة رواية لنموذج سياق مستوى المستندات لتحديد الجمل ذات الصلة بشكل حيوي في وثيقة التنبؤ بالحدث بالسجن الهدف. سيتم بعد ذلك زيادة الجملة المستهدفة بالجمل المختارة وتستهلكها النماذج اللغوية القائمة على المحولات لتعلم التمثيل المحسن. تحقيقا لهذه الغاية، يتم استخدام خوارزمية التعزيز لتدريب اختيار الجملة ذات الصلة من أجل إد. يتم بعد ذلك تقديم العديد من أنواع المعلومات لتشكيل وظيفة المكافآت لعملية التدريب، بما في ذلك أداء إد، وإشراك الجملة، وعلاقات الخطاب. تجاه تجاربنا الواسعة على مجموعات البيانات القياسية المتعددة تكشف عن فعالية النموذج المقترح، مما يؤدي إلى أداء جديد من الفنادق الجديدة.
نقترح محدب (مستخرج قيمة المحادثة)، وهو نهج عصبي فعال وضبط ناعم لمهام مربع حوار وضع العلامات. بدلا من الاعتماد على أهداف محتملة أكثر عمليا من العمل السابق (مثل النمذجة، ونمذجة اللغة، واختيار الاستجابة)، فإن مهمة محدبة محدبة، وهي مهمة عبء الزوجية الزوج ية باستخدام بيانات Reddit، تتماشى بشكل جيد مع استخدامها المقصود على مهام وضع التسلسل. وهذا يتيح تعلم معدلات الفتحات الخاصة بالمجال الخاصة بالمجال بمجرد ضبط طبقات فك تشفير طبقات تسلسل التسلسل العام للأغراض العامة، في حين يتم الاحتفاظ غالبية معلمات النموذج مسبقا المجمدة. نقوم بالإبلاغ عن أداء محدب الحديثة عبر مجموعة من المجالات المتنوعة ومجموعات البيانات لوضع علامات على فتحة الحوار، مع أكبر المكاسب في أكثر الإعدادات الصعبة والعديد من الرصاص. نعتقد أن أوقات محدبة المحدبة المختصرة (أي، فقط 18 ساعة على 12 GPUs) والتكلفة، إلى جانب ضبطها الدقيقة الفعالة وأدائها القوي، وعدت إمكانية النقل والأوسع نطاقا وتوسيع نطاق مهام وضع التسلسل الموفرة للبيانات بشكل عام.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا