ترغب بنشر مسار تعليمي؟ اضغط هنا

النصي: ناقد الانتقاد المحترفين للمحولات

SCRIPT: Self-Critic PreTraining of Transformers

445   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم محولات الاحتجاط بالانتقاد الذاتي (البرنامج النصي) لتمثيل تعلم النص.يستعيد أساليب النمذجة التي تحذر باللغة الشائعة (MM) مثل بيرت بعض الرموز مع [قناع] وتدريب التشفير لاستعادتها، في حين تربط إلكترا أن تدرب تمييزا للكشف عن الرموز المستبدل التي اقترحها مولد.على النقيض من ذلك، ندرب نموذج لغة كما هو الحال في الامتيازات والرهون البحرية وأكثر تمييزا تمييزا أو ناقدا فوق التشفير دون استخدام أي معلمات إضافية.وهذا هو، النموذج نفسه هو ناقد.يجمع البرنامج النصي بين التدريب الامتيازات والرهون البحرية والتدريب التمييزي لتعلم التمثيلات الغنية وكفاءة الحساب وعينة.نحن نوضح تحسين كفاءة عينة في الاحتجاج والتمثيلات المعززة التي يتضح من تحسين أداء المهام المصب على الغراء والتشكيل فوق خطوط خطوط خطوط خطوط خطوط طويلة.أيضا، يمكن استخدام درجات الناقد الذاتي بشكل مباشر كحب من السجل الزائف للتسجيل الفعال.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

النصوص التي تلتقط المعرفة المنطقية حول الأنشطة اليومية والمشاركين.أثبتت معرفة البرنامج النصي مفيدة في عدد من مهام NLP، مثل التنبؤ المراجع، تصنيف الخطاب، وتوليد القصة.إن خطوة حاسمة لاستغلال معرفة البرنامج النصي هي تحليل البرنامج النصي، ومهمة وضع علامة النص مع الأحداث والمشاركين من نشاط معين.هذه المهمة تحديا: إنها تتطلب معلومات حول طرق الأحداث والمشاركين عادة ما يتم نطقها في اللغة السطحية وكذلك الترتيب الذي تحدث فيه في العالم.نظهر كيفية إجراء تحليلات نصية دقيقة مع نموذج التسلسل الهرمي والتعلم التحويل.يعمل نموذجنا على تحسين حالة تقييد الأحداث بأكثر من 16 نقطة F-Score، وللمرة الأولى، يقوم المشاركين بدقة في البرامج النصية.
نماذج المحولات هي التقليب equivariant.لتزويد الطلب واكتب معلومات الرموز المميزة والإدخال، عادة ما تتم إضافتها إلى المدخلات.تعمل الأعمال الأخيرة الاختلافات المقترحة من الترميزات الموضعية مع ترميزات الموضع النسبي تحقيق أداء أفضل.يوضح تحليلنا أن المكسب يأتي في الواقع من نقل المعلومات الموضعية إلى طبقة الاهتمام من المدخلات.بدافع من ذلك، نقدم اهتماما ممتما مطردا للمحولات (النظام الغذائي)، وهي آلية بسيطة ولكنها فعالة لتشفير معلومات الموقف والقطاع في نماذج المحولات.تتمتع الطريقة المقترحة بتدريب ووقت الاستدلال بشكل أسرع، مع تحقيق أداء تنافسي في معايير الغراء وإكستريم و WMT.نحن نعتبر أكثر تعميم طريقتنا للمحولات الطويلة المدى وإظهار مكاسب الأداء.
حقق محول ومتغيراتها نجاحا كبيرا في معالجة اللغة الطبيعية.نظرا لأن طرازات المحولات ضخمة الحجم، فإن خدمة هذه النماذج هي تحديا للتطبيقات الصناعية الحقيقية.في هذه الورقة، نقترح، مكتبة الاستدلال عالية الكفاءة للنماذج في عائلة المحولات.يتضمن سلسلة من تقنيا ت تحسين GPU لكلا من تبسيط حساب طبقات المحولات وتقليل بيانات الذاكرة.يدعم النماذج المدربة باستخدام Pytorch و Tensorflow.النتائج التجريبية على معايير الترجمة الآلية القياسية تظهر أنها تحقق تصل إلى 14x تسريع مقارنة مع Tensorflow وتسريع 1.4x مقارنة مع تنفيذ CUDA المتزامن.سيتم إصدار الرمز علنا بعد المراجعة.
يعتمد نموذج الترجمة المحول على آلية الاهتمام المتعدد الرأس، والتي يمكن توازتها بسهولة.تقوم شبكة الاهتمام المتعددة بالاهتمام بأداء وظيفة اهتمام المنتج DOT-Product المعزز بالتوازي، مما تمكن من تمكين النموذج من خلال حضور المعلومات المشتركة إلى معلومات م ن مختلف الفئات الفرعية التمثيلية في مواقف مختلفة.في هذه الورقة، نقدم نهجا لتعلم اهتمام استرجاع صعب حيث يحضر رأس الاهتمام فقط إلى رمز واحد في الجملة بدلا من جميع الرموز.وبالتالي، يمكن استبدال مضاعفة المصفوفة بين احتمالات الاهتمام وتسلسل القيمة في إيلاء اهتمام منتجات DOT-Product القياسية القياسية بعملية استرجاع بسيطة وفعالة.نظظ أن آلية اهتمام استرجاعها الثابت لدينا هي 1.43 مرة أسرع في فك التشفير، مع الحفاظ على جودة الترجمة على مجموعة واسعة من مهام الترجمة الآلية عند استخدامها في شبكات فك تشفير الذات والانتباه.
حفز الأداء المتميز لنماذج اللغة القائمة على المحولات في مجموعة كبيرة ومتنوعة من المهام NLP و NLU الاهتمام باستكشاف أعمالها الداخلية. ركزت الأبحاث الحديثة بشكل أساسي على ظواهر لغوية عالية المستوى ومعقدة مثل بناء الجملة والدلالات والمعرفة العالمية والف ني المشترك. غالبية الدراسات هي أنجلجة، ولا تزال قليلا معروفة فيما يتعلق باللغات الأخرى، وتحديدا خصائص مورفوسينتانية. تحقيقا لهذه الغاية، يقدم عملنا دعوة مورف، وهو مجموعة من 46 مهام التحقيق لأربعة لغات الهند الهندية في التشكل المختلفة: الروسية والفرنسية والإنجليزية والألمانية. نقترح نوعا جديدا من المهام التحقيق بناء على الكشف عن اضطرابات الجملة الموجهة. نحن نستخدم مزيج من تقنيات التثبيت التابعة للطبقة العصبية والطبقة والتمثيل لتحليل المحتوى المورفوسنكتاكسي لأربعة محولات متعددة اللغات، بما في ذلك إصداراتهم المقطوعة. بالإضافة إلى ذلك، ندرس كيف تؤثر ضبط مهمة وضع العلامات على الأداء التحقيق.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا