ترغب بنشر مسار تعليمي؟ اضغط هنا

اعتباري هو كل ما تحتاجه: تكييف المحولات مسبقا للترجمة الآلية

Cross-Attention is All You Need: Adapting Pretrained Transformers for Machine Translation

309   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

ندرس قوة الاهتمام الشامل في بنية المحولات في سياق نقل التعلم للترجمة الآلية، وتوسيع نتائج الدراسات في انتباه متقاطع عند التدريب من الصفر.نقوم بإجراء سلسلة من التجارب من خلال ضبط نموذج الترجمة بشكل جيد على البيانات حيث تغيرت المصدر أو اللغة المستهدفة.تكشف هذه التجارب أن ضبط المعلمات الراقية فقط فعالة تقريبا مثل ضبط جميع المعلمات (I.E.، نموذج الترجمة بأكمله).نحن نقدم رؤى في سبب هذا هو الحال والمراقبة أن الحد من الضبط الجميل بهذه الطريقة يؤدي إلى تضمين متفاوت المحاذاة عبر الإنترنت.تتضمن الآثار المترتبة على هذا البحث عن الباحثين والممارسين تخفيفا من النسيان الكارثي، وإمكانية ترجمة الطلقة الصفرية، والقدرة على تمديد نماذج الترجمة الآلية إلى العديد من أزواج لغة جديدة مع انخفاض مستوى تخزين المعلمة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

منذ أن تم اعتماد النماذج العصبية في توليد لغة البيانات إلى النص، فقد تم اعتمادها دائما على المكونات الخارجية لتحسين دقتها الدلالية، لأن النماذج عادة لا تظهر القدرة على توليد نص يذكر بشكل موثوق كل المعلومات المقدمة فيالمدخل.في هذه الورقة، نقترح طريقة فك التشفير الجديدة التي تستخرج معلومات تفسيرها من نماذج ترميز تشفير التشفير، وتستخدمها لاستنتاج السمات التي يتم ذكرها في النص الذي تم إنشاؤه، والذي يستخدم لاحقا لإنقاش فرضيات شعاع.باستخدام طريقة فك التشفير هذه مع T5 و Bart، نعرض على ثلاثة مجموعات بيانات قدرتها على تقليل الأخطاء الدلالية بشكل كبير في المخرجات التي تم إنشاؤها، مع الحفاظ على جودة حديثة من بين الفن.
في هذه الورقة، نصف نظامنا المستخدم في مهمة Semeval 2021 7: hahackathon: الكشف عن الفكاهة والجريمة.استخدمنا نهجا بسيطا للضبط باستخدام نماذج لغة مدربة مسبقا مختلفة (PLMS) لتقييم أدائها للكشف عن الفكاهة والجريمة.بالنسبة لمهام الانحدار، بلغنا متوسط عدد ا لنماذج المختلفة التي تؤدي إلى أداء أفضل من النماذج الأصلية.شاركنا في جميع المساحات الفرعية.تم تصنيف نظامنا الأفضل أداء في المرتبة 4 في SubTask 1-B، 8 في SubTask 1-C، 12 في SubTask 2، وأداء جيدا في التركيز 1-A.نوضح نتائج شاملة أخرى باستخدام نماذج لغة مدربة مسبقا مسبقا والتي ستساعد على أنها خطوط أساس للعمل في المستقبل.
تقدم هذه الورقة نظامنا للحصول على تحديد كمية الكمية، وحدة تحديد الهوية القياس وتصنيف مستوى القيمة الفرعية من المهمة 2021.كان الغرض من مهمة تحديد الكمية تحديد موقع تحديد موقع تمديد النصوص التي تحتوي على عدد أو قياس، يتكون من قيمة، يتبعها عادة وحدة ومع دلات إضافية في بعض الأحيان.كان الهدف من مهمة تصنيف المعدل هو تحديد ما إذا كان جزءا مرتبطا مرتبطا بالإشارة إلى النطاق، والتسامح، والقيمة المتوسطة، وما إلى ذلك من كمية.استخدمت الأنظمة المتقدمة نماذج بيرت المدربة مسبقا والتي كانت ذات صقل مهمة في متناول اليد.نقدم نظامنا، والتحقيق في كيفية تأثير القرارات المعمارية تنبؤات نموذجية، وإجراء تحليل خطأ.بشكل عام، وضع نظامنا 12/19 في المهمة المشتركة وفي المكان الثاني للفئة الفرعية الوحدة.
تصف هذه الورقة تقديمنا إلى مهمة Semeval-2021 1: التنبؤ بدرجة التعقيد لكلمات واحدة.النموذج لدينا يهدف إلى ارتفاع الميزات المورفوسنكتاكيتش والمترددات المستندة إلى التردد التي أثبتت أنها مفيدة لتحديد الكلمات المعقدة (مهمة ذات صلة)، وتجمع بينها مع تنبؤات مصنوعة من النماذج المدربة المستندة إلى المحولات التي تم ضبطها بشكل جيد على بيانات المهام المشتركة.تداولات نظام التقديم لدينا جميع النماذج السابقة مع LightgBM في الأعلى.يتمثل أحد الجدة في نهجنا في استخدام التعلم متعدد المهام لضبط النموذج المدرب مسبقا لكلا التنبؤ في التعقيد المعجمي و disambiguation معنى الكلمة.يوضح تحليلنا أن جميع النماذج المستقلة تحقق أداء جيدا في المهمة، ولكن أن تكديسها يحصل على علاقة بيرسون ب 0.7704، فقط 0.018 نقطة خلف التقديم الفائز.
تتناول هذه الورقة مناهج مختلفة لمهمة الكشف عن المسيح السامة. كانت المشكلة التي تطرحتها المهمة هي تحديد الكلمات التي تساهم في الغالب في الاعتراف بالوثيقة السامة. على عكس التصنيف الثنائي للنصوص بأكملها، يمكن أن يكون التقييم على مستوى الكلمات استخداما ك بيرا خلال الاعتدال التعليق، والسماح أيضا بفهم أكثر متعمقا من تنبؤات النموذج. نظرا لأن الهدف الرئيسي هو ضمان الشفافية والتفاهم، تركز هذه الورقة على النهج الحالية للدولة الحالية بناء على مفاهيم منظمة العفو الدولية القابلة للتفسير ويقارنها بحل تعليمي مشارضة مع تسميات مستوى الكلمات. يتكون العمل من أساليب Xai التي توفر توضيحا تلقائيا للنماذج المدربة للتصنيف الثنائي للوثائق السامة: نموذج LSTM مع الاهتمام كهدوء خاص بالنماذج وقيم SHOPLEY لتفسير تنبؤات برت كطريقة نموذجية للنموذج. تعتبر النهج المتنافس هذه المشكلة كتصنيف رمزي تحت إشراف، حيث تم اختبار النماذج مثل بيرت وتعديلاتها. تهدف الورقة إلى استكشاف وقارن وتقييم جودة التنبؤات بطرق مختلفة في المهمة. كما تمت مناقشة مزايا كل نهج وإشراف البحث الإضافي أيضا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا