غالبا ما تتطلب تطبيقات العالم الواقعي نماذج محسنة عن طريق الاستفادة * مجموعة من إشارات الإشراف العرضي الرخيص *. يمكن أن تشمل هذه ملصقات جزئية، ملصقات صاخبة، قيود قائمة على المعرفة، والشروح عبر المجال أو التعليق الشرح - جميعها وجود ارتباطات إحصائية مع شروح ذهبية ولكن ليس نفسها بالضبط. ومع ذلك، فإننا نفتقر حاليا إلى طريقة مبدئية لقياس فوائد هذه الإشارات إلى مهمة مستهدفة معينة، والممارسة المشتركة لتقييم هذه الفوائد هي من خلال تجارب شاملة مع نماذج مختلفة وليفرتات. تدرس هذه الورقة ما إذا كان بإمكاننا ذلك، * في إطار واحد، حدد فوائد أنواع مختلفة من الإشارات العرضية لمهمة مستهدحة معينة دون ممارسة التجارب بين التجديف *. نقترح نقلا عن تدبير المعلومات الدوافع PAC-Bayesian الموحدة، PABI، الذي يميز الحد من عدم اليقين المنصوص عليه من إشارات الإشراف العرضي. نوضح فعالية PABI عن طريق تحديد القيمة المضافة من قبل أنواع مختلفة من الإشارات العرضية إلى مهام علامات التسلسل. تشير التجارب على التعرف على الكيان المسمى (NER) وإجابة السؤال (QA) أن تنبؤات Pabi ترتبط بشكل جيد مع أداء التعلم، مما يوفر طريقة واعدة لتحديد، قبل التعلم، التي ستكون إشارات الإشراف مفيدة.
Real-world applications often require improved models by leveraging *a range of cheap incidental supervision signals*. These could include partial labels, noisy labels, knowledge-based constraints, and cross-domain or cross-task annotations -- all having statistical associations with gold annotations but not exactly the same. However, we currently lack a principled way to measure the benefits of these signals to a given target task, and the common practice of evaluating these benefits is through exhaustive experiments with various models and hyperparameters. This paper studies whether we can, *in a single framework, quantify the benefits of various types of incidental signals for a given target task without going through combinatorial experiments*. We propose a unified PAC-Bayesian motivated informativeness measure, PABI, that characterizes the uncertainty reduction provided by incidental supervision signals. We demonstrate PABI's effectiveness by quantifying the value added by various types of incidental signals to sequence tagging tasks. Experiments on named entity recognition (NER) and question answering (QA) show that PABI's predictions correlate well with learning performance, providing a promising way to determine, ahead of learning, which supervision signals would be beneficial.
المراجع المستخدمة
https://aclanthology.org/
يتم تعريف حدود قابلية تطبيق نماذج الرؤية واللغة من خلال تغطية بياناتها التدريبية. تتطلب المهام مثل الرؤية الإجابة على الأسئلة (VQA) في كثير من الأحيان معلومات المنطقية والواقعية تتجاوز ما يمكن تعلمه من مجموعات البيانات الخاصة بمهام المهام. تحقق هذه ا
نحن تصف ثلاثة أنظمة تفوق خطوط خط أساس للمهمة الفرعية للإنجليزية فقط فقط من المهمة المشتركة Sigmorphon 2021 1: مجموعة صغيرة يستخدم فريق التعرف على الكلام في Dialpad داخليا، نموذجا غير معروف من الرف، وأكبرنموذج الفرقة التي تضم هذه وغيرها.نناقش التحديات
تتطلب شبكات العصبية العميقة الحديثة من بين الفن بيانات تدريبية ذات صلة واسعة النطاق غالبا ما تكون مكلفة للحصول على أو غير متوفرة للعديد من المهام. لقد ثبت أن الإشراف ضعيف في شكل قواعد خاصة بالمجال مفيدا في مثل هذه الإعدادات لإنشاء بيانات التدريب المس
تعتمد أنظمة مجردة للاستفادة من النطاق المفتوح (OpenQA) بشكل عام على المسترد لإيجاد مقاطع مرشحة في كوربس كبيرة وقارئ لاستخراج إجابات من تلك الممرات.في العمل الحديث بكثير، المسترد هو عنصر تعلم يستخدم تمثيلات ناقلات الخشنة من الأسئلة والمرورات.نقول أن خ
أحد كتل المبنى الأولى لإنشاء مساعد صوت يتعلق بمهمة وضع علامة الكيانات أو السمات في استعلامات المستخدم. يمكن أن يكون هذا تحديا بشكل خاص عندما تكون الكيانات في العاشر من الملايين، كما هو الحال على سبيل المثال كتالوجات الموسيقى. تتطلب نماذج وضع العلامات