ترغب بنشر مسار تعليمي؟ اضغط هنا

المعلمة تعامل الفضاء للتعلم صفر النار عبر المهام واللغات

Parameter Space Factorization for Zero-Shot Learning across Tasks and Languages

546   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مجردة معظم مجموعات مهام NLP والأصناف اللغوية تفتقر إلى أمثلة في المجال للتدريب الخاضع للإشراف بسبب قلة البيانات المشروحة. كيف يمكن النماذج العصبية أن تجعل تعميمات فعالة للعينة من مجموعات لغات المهام مع البيانات المتاحة للموارد المنخفضة؟ في هذا العمل، نقترح نموذجا إيلائيا بايزيا لمساحة المعلمات العصبية. نفترض أن هذه المساحة يمكن أن تعصبها في متغيرات كامنة لكل لغة وكل مهمة. نحن نستنتج المشتريات حول هذه المتغيرات الكامنة بناء على بيانات من مجموعات لغة المهام المشاهدة من خلال الاستدلال المتغيرات. وهذا يتيح تصنيف صفري بالرصاص على مجموعات غير مرئية في وقت التنبؤ. على سبيل المثال، نظرا لبيانات التدريب للتعرف على الكيان المسمى (NER) في الفيتنامية ولليزة جزء من الكلام (POS) (POS) في Wolof، يمكن أن يؤدي نموذجنا إلى إجراء تنبؤات دقيقة ل NER في Wolof. على وجه الخصوص، نقوم بتجربة عينة متنوعة من 33 لغة من 4 قارات و 11 أسرة، وإظهار أن نموذجنا ينتج عنه نتائج قابلة للمقارنة أو أفضل من أساليب التحويل المتبادلة الصفرية من بين الفن. يتوفر الكود الخاص بنا في github.com/cambridgeltl/parameter-factorization.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نتطلع إلى تحيز أخذ العينات والقضايا الخارجية في عدد قليل من التعلم عن اكتشاف الحدث، وهو متعقب فرعي لاستخراج المعلومات.نقترح نموذج العلاقات بين المهام التدريبية في التعلم القليل من الرصاص البارز من خلال إدخال نماذج النماذج عبر المهام.ونحن نقترح كذ لك فرض اتساق التنبؤ بين المصنفين عبر المهام لجعل النموذج أكثر قوة على القيم المتطرفة.تظهر تجربتنا الواسعة تحسنا ثابتا على ثلاث مجموعات من مجموعات بيانات التعلم قليلة.تشير النتائج إلى أن نموذجنا هو أكثر قوة عند وصف بيانات المسمى لأنواع الأحداث الرواية محدودة.يتوفر شفرة المصدر على http://github.com/laiviet/fsl-proact.
في هذه الورقة، ندرس مشكلة الاعتراف بمفاهيم كائن السمات التركيبية داخل إطار التعلم الصفرية (ZSL). نقترح شبكة اعتقالة على الحلقة (EPICA) التي تعتمد على الحلقة التي تجمع بين مزايا آلية الانتباه العابر واستراتيجية التدريب القائمة على الحلقة للتعرف على ال مفاهيم التركيبية الجديدة. أولا، قواعد ابيكا على الانتباه إلى ربط المعلومات المفاهيمية وتستخدم طبقة تجمع بوابات لبناء تمثيلات سياقية لكل من الصور والمفاهيم. يتم استخدام التمثيلات المحدثة لحساب ذات الصلة متعددة الوسائط أكثر فائدة للتعرف على المفهوم. ثانيا، يتم اعتماد استراتيجية تدريب الحلقة ذات الطورين، وخاصة المرحلة الرانسطة، للاستفادة من أمثلة الاختبار غير المسبقة لتخفيف مشكلة تعلم الموارد المنخفضة الموارد. أظهرت التجارب على معايير التعلم التركيبية المتفوقة (ZSCL) المتسعة (ZSCL) فعالية النموذج مقارنة بالنهج الحديثة على كل من إعدادات ZSCL التقليدية والعالمية.
بناء نظام الدعم الفني التلقائي هو مهمة مهمة ولكن التحدي.من الناحية النظرية، للإجابة على سؤال المستخدم في منتدى فني، يتعين على خبير بشري استرداد المستندات ذات الصلة أولا، ثم اقرأها بعناية لتحديد مقتطف الإجابة.على الرغم من النجاح الهائل، فقد حقق الباحث ون في التعامل مع أسئلة النطاق العامة الإجابة (ضمان الجودة)، وقد تم دفع الاهتمام الأقل بكثير مقابل التحقيق الفني في تشاينا.على وجه التحديد، تعاني الأساليب الموجودة من العديد من التحديات الفريدة (I) تتداخل السؤال والإجابة نادرا ما يتداخل بشكل كبير و (2) بحجم بيانات محدود للغاية.في هذه الورقة، نقترح إطارا جديدا لتعلم النقل العميق لمعالجة ضمان الجودة الفنية بشكل فعال عبر المهام والمجالات.تحقيقا لهذه الغاية، نقدم نهجا للتعلم المشترك قابل للتعديل لمهام استدعاء المستندات والقراءة.تجاربنا على Techqa توضح أداء فائق مقارنة بالطرق الحديثة.
تصف هذه الورقة التقديم الخاص بنا إلى مهمة Semeval 2021 2. نحن نقارن قاعدة XLM-Roberta وكبير في إعدادات القليل من اللقطات والطلق الرصاص واختبار فعاليا فعالية استخدام مصنف جيران K-Enter في إعداد القليل من القصاصات بدلا منأكثر التقليدية متعددة الطبقات p erceptron.تظهر تجاربنا على كل من البيانات متعددة اللغات واللغة أن XLM-Roberta Large، على عكس الإصدار الأساسي، يمكن أن يكون قادرا على نقل التعلم بشكل أكثر فعالية في بيض بضع طلقة وأن مصنف الجيران K-Neave هو في الواقعمصنف أكثر قوة من بيرسيبترون متعدد الطبقات عند استخدامه في التعلم القليل من اللقطة.
يمكن للكشف عن الموقف على وسائل التواصل الاجتماعي المساعدة في تحديد وفهم الأخبار أو التعليق المائل في الحياة اليومية.في هذا العمل، نقترح نموذجا جديدا للكشف عن موقف صفرية على Twitter يستخدم التعلم الخصم للتعميم عبر الموضوعات.ينص نموذجنا على الأداء الحد يث في عدد من موضوعات الاختبار غير المرئية بأقل تكلفة حسابية.بالإضافة إلى ذلك، فإننا نقوم بإعادة اكتشاف موقف الرصاص في الصفر إلى المواضيع التي لم تعتبر سابقا، وتسليط الضوء على الاتجاهات المستقبلية للتحويل الصفر بالرصاص.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا