نقترح محدب (مستخرج قيمة المحادثة)، وهو نهج عصبي فعال وضبط ناعم لمهام مربع حوار وضع العلامات. بدلا من الاعتماد على أهداف محتملة أكثر عمليا من العمل السابق (مثل النمذجة، ونمذجة اللغة، واختيار الاستجابة)، فإن مهمة محدبة محدبة، وهي مهمة عبء الزوجية الزوجية باستخدام بيانات Reddit، تتماشى بشكل جيد مع استخدامها المقصود على مهام وضع التسلسل. وهذا يتيح تعلم معدلات الفتحات الخاصة بالمجال الخاصة بالمجال بمجرد ضبط طبقات فك تشفير طبقات تسلسل التسلسل العام للأغراض العامة، في حين يتم الاحتفاظ غالبية معلمات النموذج مسبقا المجمدة. نقوم بالإبلاغ عن أداء محدب الحديثة عبر مجموعة من المجالات المتنوعة ومجموعات البيانات لوضع علامات على فتحة الحوار، مع أكبر المكاسب في أكثر الإعدادات الصعبة والعديد من الرصاص. نعتقد أن أوقات محدبة المحدبة المختصرة (أي، فقط 18 ساعة على 12 GPUs) والتكلفة، إلى جانب ضبطها الدقيقة الفعالة وأدائها القوي، وعدت إمكانية النقل والأوسع نطاقا وتوسيع نطاق مهام وضع التسلسل الموفرة للبيانات بشكل عام.
We propose ConVEx (Conversational Value Extractor), an efficient pretraining and fine-tuning neural approach for slot-labeling dialog tasks. Instead of relying on more general pretraining objectives from prior work (e.g., language modeling, response selection), ConVEx's pretraining objective, a novel pairwise cloze task using Reddit data, is well aligned with its intended usage on sequence labeling tasks. This enables learning domain-specific slot labelers by simply fine-tuning decoding layers of the pretrained general-purpose sequence labeling model, while the majority of the pretrained model's parameters are kept frozen. We report state-of-the-art performance of ConVEx across a range of diverse domains and data sets for dialog slot-labeling, with the largest gains in the most challenging, few-shot setups. We believe that ConVEx's reduced pretraining times (i.e., only 18 hours on 12 GPUs) and cost, along with its efficient fine-tuning and strong performance, promise wider portability and scalability for data-efficient sequence-labeling tasks in general.
References used
https://aclanthology.org/
Few-shot learning arises in important practical scenarios, such as when a natural language understanding system needs to learn new semantic labels for an emerging, resource-scarce domain. In this paper, we explore retrieval-based methods for intent c
We explore few-shot learning (FSL) for relation classification (RC). Focusing on the realistic scenario of FSL, in which a test instance might not belong to any of the target categories (none-of-the-above, [NOTA]), we first revisit the recent popular
Intent classification (IC) and slot filling (SF) are critical building blocks in task-oriented dialogue systems. These two tasks are closely-related and can flourish each other. Since only a few utterances can be utilized for identifying fast-emergin
While FrameNet is widely regarded as a rich resource of semantics in natural language processing, a major criticism concerns its lack of coverage and the relative paucity of its labeled data compared to other commonly used lexical resources such as P
Masked language modeling (MLM) is one of the key sub-tasks in vision-language pretraining. In the cross-modal setting, tokens in the sentence are masked at random, and the model predicts the masked tokens given the image and the text. In this paper,