ترغب بنشر مسار تعليمي؟ اضغط هنا

في هذه الورقة، نقترح نظام التحقق والتحقق من حقائق جديدة للتحقق من مطالبات محتوى ويكيبيديا.يسترد نظامنا صفحات ويكيبيديا ذات الصلة باستخدام Anserini، ويستخدم نموذج الإجابة على السؤال من Bert-Bert-bert-Berted لتحديد الأدلة الصحيحة، وتحقق من المطالبات با ستخدام نموذج الاستدلال باللغة الطبيعية XLNet بمقارنتها بالأدلة.يتم الحصول على أدلة خلية الجدول من خلال البحث عن قيم الخلايا المطابقة للكيان وسؤال الجدول Tapas نموذج الرد على نموذج.يستخدم خط الأنابيب إمكانيات الطلقة الصفرية للنماذج الحالية وجميع النماذج المستخدمة في خط الأنابيب لا يتطلب أي تدريب إضافي.حصل نظامنا على درجة حمامة من 0.06 ودقة ملصقة تبلغ 0.39 في التحدي الحمير.
مجردة معظم مجموعات مهام NLP والأصناف اللغوية تفتقر إلى أمثلة في المجال للتدريب الخاضع للإشراف بسبب قلة البيانات المشروحة. كيف يمكن النماذج العصبية أن تجعل تعميمات فعالة للعينة من مجموعات لغات المهام مع البيانات المتاحة للموارد المنخفضة؟ في هذا العمل، نقترح نموذجا إيلائيا بايزيا لمساحة المعلمات العصبية. نفترض أن هذه المساحة يمكن أن تعصبها في متغيرات كامنة لكل لغة وكل مهمة. نحن نستنتج المشتريات حول هذه المتغيرات الكامنة بناء على بيانات من مجموعات لغة المهام المشاهدة من خلال الاستدلال المتغيرات. وهذا يتيح تصنيف صفري بالرصاص على مجموعات غير مرئية في وقت التنبؤ. على سبيل المثال، نظرا لبيانات التدريب للتعرف على الكيان المسمى (NER) في الفيتنامية ولليزة جزء من الكلام (POS) (POS) في Wolof، يمكن أن يؤدي نموذجنا إلى إجراء تنبؤات دقيقة ل NER في Wolof. على وجه الخصوص، نقوم بتجربة عينة متنوعة من 33 لغة من 4 قارات و 11 أسرة، وإظهار أن نموذجنا ينتج عنه نتائج قابلة للمقارنة أو أفضل من أساليب التحويل المتبادلة الصفرية من بين الفن. يتوفر الكود الخاص بنا في github.com/cambridgeltl/parameter-factorization.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا