ترغب بنشر مسار تعليمي؟ اضغط هنا

تهدف مهمة التحقق من الحقائق القائمة على الطاولة إلى التحقق مما إذا كان البيان المحدد مدعوم من الجدول شبه المنظم المحدد. يلعب المنطق الرمزي مع العمليات المنطقية دورا حاسما في هذه المهمة. الأساليب الحالية الاستفادة من البرامج التي تحتوي على معلومات منط قية غنية لتعزيز عملية التحقق. ومع ذلك، نظرا لعدم وجود إشارات خاضعة للإشراف بالكامل في عملية توليد البرنامج، يمكن استخلاص البرامج الزائفة وعملها، مما يؤدي إلى عدم قدرة النموذج على العمليات المنطقية المفيدة. لمعالجة المشكلات المذكورة أعلاه، في هذا العمل، نقوم بصياغة مهمة التحقق من الحقائق القائمة على الطاولة كإطار لاسترجاع الأدلة والتفكير، حيث اقترح شبكة التحقق من الأدلة على مستوى المنطق وشبكة التحقق القائمة على الرسم البياني (LERGV). على وجه التحديد، نقوم أولا باسترجئة الأدلة التي تشبه البرامج على مستوى المنطق من الجدول المعطى والبيان كدليل تكميلي على الطاولة. بعد ذلك، نقوم بإنشاء رسم بياني لمستوى منطقي لالتقاط العلاقات المنطقية بين الكيانات والوظائف في الأدلة المستردة، وتصميم شبكة التحقق القائمة على الرسم البياني لإجراء المنطق المستندة إلى الرسم البياني على مستوى المنطق بناء على الرسم البياني الذي تم إنشاؤه لتصنيف النهائي علاقة استقامة. النتائج التجريبية على Tabract Tabract القياسي على نطاق واسع تظهر فعالية النهج المقترح.
توفر الجداول معرفة قيمة يمكن استخدامها للتحقق من العبارات النصية. في حين أن عددا من الأعمال قد نظر في التحقق من الحقائق القائم على الطاولة، فإن المحاذاة المباشرة للبيانات الجذابية مع الرموز في البيانات النصية نادرا ما توفرها. علاوة على ذلك، فإن تدريب نموذج التحقق من الحقائق المعممة يتطلب بيانات تدريبية ملصقة وفيرة. في هذه الورقة، نقترح نظام رواية لمعالجة هذه المشكلات. مستوحاة من السببية المتعددة، يحدد نظامنا من رجال الصمغ على مستوى الرمز في البيان مع تقدير البحار الذي يستند إلى التحقيق. يتيح تقدير Salience التعلم المعزز للتحقق من الحقائق من وجهات نظر. من منظور واحد، يقوم نظامنا بإجراء تنبؤ ممثن بالبرنامج المريح لتعزيز النموذج للمحاذاة والتفكير بين الطاولة والبيان. من المنظور الآخر، ينطبق نظامنا على توضيح تكبير البيانات الإدراك بالاستثناء لإنشاء مجموعة متنوعة من مثيلات التدريب عن طريق استبدال المصطلحات غير البارزة. تظهر النتائج التجريبية على Tabract التحسن الفعال من خلال تقنيات التعلم التي أدركها Carience المقترحة، مما يؤدي إلى أداء Sota الجديد على المعيار.
في هذه الورقة، نقدم مجموعة بيانات مفهوم التحقق من قراءة جديدة تسمى vgaokao من اختبارات اللغة الصينية في Gaokao.تختلف عن الجهود الحالية، تم تصميم مجموعة البيانات الجديدة في الأصل لتقييم المتحدثين الأصليين، وبالتالي تتطلب مهارات تفاهم لغة أكثر تقدما.لم عالجة التحديات في Vgaokao، نقترح نهجا جديدا متناكج للمتخصص، الذي يختار تكرارا دليلا تكميليا مع وجود آلية تحديث استعلام رواية وأدلة تدعم تكاليف، تليها مسابقة زوجية لدفع النماذج لتعلم الفرق الدقيق بين ما شابه ذلكقطع النص.تبين التجارب أن أساليبنا تتفوق على مختلف خطوط الأساس على Vgaokao مع أدلة تكميلية مستردة، مع وجود مزايا الكفاءة والشرطية.يتم إصدار DataSet و Code لدينا لمزيد من البحث.
في هذه الورقة، نقترح نظام التحقق والتحقق من حقائق جديدة للتحقق من مطالبات محتوى ويكيبيديا.يسترد نظامنا صفحات ويكيبيديا ذات الصلة باستخدام Anserini، ويستخدم نموذج الإجابة على السؤال من Bert-Bert-bert-Berted لتحديد الأدلة الصحيحة، وتحقق من المطالبات با ستخدام نموذج الاستدلال باللغة الطبيعية XLNet بمقارنتها بالأدلة.يتم الحصول على أدلة خلية الجدول من خلال البحث عن قيم الخلايا المطابقة للكيان وسؤال الجدول Tapas نموذج الرد على نموذج.يستخدم خط الأنابيب إمكانيات الطلقة الصفرية للنماذج الحالية وجميع النماذج المستخدمة في خط الأنابيب لا يتطلب أي تدريب إضافي.حصل نظامنا على درجة حمامة من 0.06 ودقة ملصقة تبلغ 0.39 في التحدي الحمير.
في هذه الورقة، نستخدم تعميم المجال لتحسين أداء نظام التحقق من مكبر الصوت عبر الأجهزة.استنادا إلى نظام التحقق من المتكلم التدريبي، نستخدم خوارزميات تعميم المجال لضبط المعلمات النموذجية.أولا، نستخدم DataSet Voxceleb2 لتدريب ECAPA-TDNN كنموذج أساسي.ثم ا ستخدم مجموعة بيانات ChT-TDSV وخوارزميات تعميم المجال التالية لضبطها: Dann، CDNN، Coral Coral.اختبارات نظامنا المقترح 10 سيناريوهات مختلفة في مجموعة بيانات NSYSU-TDSV، بما في ذلك جهاز واحد وأجهزة متعددة.أخيرا، في سيناريو الأجهزة المتعددة، انخفض أفضل معدل خطأ على قدم المساواة من 18.39 في الأساس إلى 8.84.حقق بنجاح تحديد الهوية عبر الجهاز على نظام التحقق من مكبر الصوت.
تصف هذه الورقة نظامنا للتحقق من العبارات مع الجداول في مهمة Semeval-2021 9. قمنا بتطوير نظام للتحقق من مرحلتين يعتمد على أحدث طراز Grappa المدرب مسبقا على الطاولة.يتم وضع شبكات متعددة للتحقق من أنواع مختلفة من العبارات في DataSet المسابقة وتطبق تقنية تكيفية نموذجية نموذجية على نماذج الفرقة في كلتا المراحل.يتم استخدام وحدة عملية تشغيل رمزية قائمة على البيان في نظامنا في نظامنا لتعزيز أداء النظام واستقراره.يحقق نموذجنا المركز الثاني في التصنيف ثلاثي الاتجاه والمركز الرابع في تقييم التصنيف الثاني في الاتجاه.تظهر العديد من التجارب الاجتثاث فعالية الوحدات المختلفة المقترحة في هذه الورقة.
نقدم طريقة عامة لحساب الدقة الملحة لتخفيف البيانات الناتجة عن الحد الأدنى من جهود المستخدم.نحن ننظر إلى Prob-Lem كهامة لفحص الحقائق للتحقق من مطالبات NU-Merical في النص.يفترض التحقق من Gorithm أن البيانات المستخدمة في الحصول على النص متاح.في هذه الور قة، نقوم بفاية استخدام الحل المقترح قد استخدمه هذه المطالبات غير الصحيحة حول ملخصات كرة السلة TEX-Tual في سياق مهمة بدقة في INLG 2021.
تصف هذه الورقة نهجنا للمهمة 9 من Semeval 2021: التحقق من البيان وإصدار الأدلة مع الجداول.شاركنا في كل من المجموعات الفرعية، أي بيان التحقق من البيان وإيجاد الأدلة.بالنسبة إلى المراكز الفرعية للتحقق من العبارات، نقوم بتوسيع نموذج Tapas للتكيف مع فئة ا لبيانات المجهولة من خلال Finet Inetuning عليه في إصدار معدات من بيانات المهمة.للحصول على الترجمة الفرعية للنتيجة الأدلة، نحن Finetune نموذج التوريد في إعداد سيامي.
يتم استخدام الجداول على نطاق واسع في أنواع مختلفة من المستندات لتقديم المعلومات بإيجاز. يعد فهم الجداول مشكلة صعبة تتطلب فهم لغة اللغة والجدول، إلى جانب التفكير العددي والمنطقي. في هذه الورقة، نقدم أنظمتنا لحل المهمة 9 من Semeval-2021: التحقق من البي ان وإصدار الأدلة مع الجداول (SEM-Tab-Facts). تتكون المهمة من اثنين من المهام: (أ) بالنظر إلى جدول وبيان، يتوقع ما إذا كان الجدول يدعم البيان و (ب) التنبؤ بالخلايا الموجودة في الجدول تقديم أدلة على / ضد البيان. نحن نايت Tune Tapas (نموذج يمتد بنية بيرت لالتقاط بنية جدولي) لكل من المهام الفرعية حيث أظهرت أداء حالة من بين الفن في مهام فهم الجدول المختلفة. في SubTask a، نقيم كيفية نقل التعلم وتوحيد الجداول للحصول على صف رأس واحد يحسن أداء Tapas. في SubTask B، نقيم مدى اختلاف استراتيجيات ضبط التوصيل المختلفة تحسين أداء Tapas. حقق أنظمتنا درجة F1 من 67.34 في التراكب الفرعي تصنيف ثلاثي الاتجاه، 72.89 في فرعية تصنيف ثنائية الاتجاه، و 62.95 في الفرعية B.
تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: ا لتحقق من الحقائق وأدلة العثور على بيانات جدولية في الوثائق العلمية (حقائق SEM-Tab-Facts). تحتوي DataSet الخاصة بنا على 981 طاولة تم إنشاؤها يدويا وحدات بيانات تم إنشاؤها تلقائيا من 1980 طاولة توفر أكثر من 180 كيلو وايت وأكثر من 16 متر من التعليقات التوضيحية. ظهرت حقائق SEM-Tab مهام فرعية. في مهمة فرعية أ، كان الهدف هو تحديد ما إذا كان بيان مدعوم أو دحض أو غير معروف فيما يتعلق بجدول. في المهمة الفرعية B، كان التركيز على تحديد الخلايا المحددة للطاولة التي توفر أدلة على البيان. 69 وقعت فرق للمشاركة في المهمة مع 19 تقارير ناجحة إلى الفرعية و 12 من عروض ناجحة إلى Subtask B. نقدم نتائجنا والنتائج الرئيسية من المسابقة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا