في هذه الورقة، ندرس مشكلة الاعتراف بمفاهيم كائن السمات التركيبية داخل إطار التعلم الصفرية (ZSL). نقترح شبكة اعتقالة على الحلقة (EPICA) التي تعتمد على الحلقة التي تجمع بين مزايا آلية الانتباه العابر واستراتيجية التدريب القائمة على الحلقة للتعرف على المفاهيم التركيبية الجديدة. أولا، قواعد ابيكا على الانتباه إلى ربط المعلومات المفاهيمية وتستخدم طبقة تجمع بوابات لبناء تمثيلات سياقية لكل من الصور والمفاهيم. يتم استخدام التمثيلات المحدثة لحساب ذات الصلة متعددة الوسائط أكثر فائدة للتعرف على المفهوم. ثانيا، يتم اعتماد استراتيجية تدريب الحلقة ذات الطورين، وخاصة المرحلة الرانسطة، للاستفادة من أمثلة الاختبار غير المسبقة لتخفيف مشكلة تعلم الموارد المنخفضة الموارد. أظهرت التجارب على معايير التعلم التركيبية المتفوقة (ZSCL) المتسعة (ZSCL) فعالية النموذج مقارنة بالنهج الحديثة على كل من إعدادات ZSCL التقليدية والعالمية.
In this paper, we study the problem of recognizing compositional attribute-object concepts within the zero-shot learning (ZSL) framework. We propose an episode-based cross-attention (EpiCA) network which combines merits of cross-attention mechanism and episode-based training strategy to recognize novel compositional concepts. Firstly, EpiCA bases on cross-attention to correlate conceptvisual information and utilizes the gated pooling layer to build contextualized representations for both images and concepts. The updated representations are used for a more indepth multi-modal relevance calculation for concept recognition. Secondly, a two-phase episode training strategy, especially the ransductive phase, is adopted to utilize unlabeled test examples to alleviate the low-resource learning problem. Experiments on two widelyused zero-shot compositional learning (ZSCL) benchmarks have demonstrated the effectiveness of the model compared with recent approaches on both conventional and generalized ZSCL settings.
References used
https://aclanthology.org/
Humans are capable of learning novel concepts from very few examples; in contrast, state-of-the-art machine learning algorithms typically need thousands of examples to do so. In this paper, we propose an algorithm for learning novel concepts by repre
Stance detection on social media can help to identify and understand slanted news or commentary in everyday life. In this work, we propose a new model for zero-shot stance detection on Twitter that uses adversarial learning to generalize across topic
In this paper, we propose a novel fact checking and verification system to check claims against Wikipedia content. Our system retrieves relevant Wikipedia pages using Anserini, uses BERT-large-cased question answering model to select correct evidence
Abstract Most combinations of NLP tasks and language varieties lack in-domain examples for supervised training because of the paucity of annotated data. How can neural models make sample-efficient generalizations from task--language combinations with
This paper describes our submission to SemEval 2021 Task 2. We compare XLM-RoBERTa Base and Large in the few-shot and zero-shot settings and additionally test the effectiveness of using a k-nearest neighbors classifier in the few-shot setting instead