ترغب بنشر مسار تعليمي؟ اضغط هنا

إعادة التفكير في الاضطرابات في فك ترميز التشفير للتدريب السريع

Rethinking Perturbations in Encoder-Decoders for Fast Training

219   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نحن غالبا ما نستخدم الاضطرابات لتنظيم النماذج العصبية.بالنسبة للكشف عن المشفر العصبي، طبقت الدراسات السابقة أخذ العينات المجدولة (بنغيو وآخرون.، 2015) والاضطرابات الخصومة (SATO et al.، 2019) كشراءات ولكن هذه الطرق تتطلب وقتا حسابيا كبيرا.وبالتالي، فإن هذه الدراسة تعالج مسألة ما إذا كانت هذه الأساليب فعالة بما يكفي لتدريب الوقت.قارنا العديد من الاضطرابات في مشاكل التسلسل إلى التسلسل فيما يتعلق بالوقت الحاسوبية.تظهر النتائج التجريبية أن التقنيات البسيطة مثل Hold Dropout (GAL و GHAHRAMANI، 2016) واستبدال عشوائي من الرموز المدخلات يحققون درجات قابلة للمقارنة (أو أفضل) إلى الاضطرابات المقترحة مؤخرا، على الرغم من أن هذه الطرق البسيطة أسرع.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع تفكير بطيء و تفكير سريع ت
في ظل الانتشار الواسع للشبكات الحديثة و السريعة و الحاجة لتطبيقات هامة و حرجة، أضحى موضوح المحافظة على الاستمرارية و الموثوقية العالية و تأمين جودة الخدمة المطلوبة شيئاً أساسياً. آليات التعافي (Recovery Mechanism) المتبعة من قبل شبكات IP الحالية تستغ رق زمناً طويلاً من عدة ثوان إلى عدة دقائق, مما يؤدي إلى ضياع كبير في رزم البيانات. تُعتبر MPLS تقنية الجيل القادم في بنى الشبكات, التي يمكن أن تسرع إرسال الرزم إلى وجهتها عبر تبديل الوسوم و خصوصاُ مع تفوقها في هندسة الحركة. نالت آليات التعافي لـ MPLS شهرةً متزايدة لأنها تضمن الاسترداد السريع من الفشل مع ضمان عالٍ لجودة الخدمة. نقوم في هذا البحث بمحاكاة عدة سيناريوهات لفشل الوصلة باستخدام تقنية إعادة التوجيه السريع (Fast Reroute) في شبكات MPLS عبر برنامج OPNET و تشير النتائج إلى نجاح هذه التقنية في الحد من التأخير و فقدان رزم البيانات في أثناء عملية الاسترداد.
تم استخدام نماذج ترميز فك التشفير بشكل شائع للعديد من المهام مثل الترجمة الآلية وتوليد الاستجابة.كما ذكرت البحث السابق، تعاني هذه النماذج من توليد التكرار الزائد.في هذا البحث، نقترح آلية جديدة لنماذج تشفير التشفير التي تقدر الاختلاف الدلالي في جملة م صدر قبل وبعد تغذية في نموذج فك التشفير لالتقاط الاتساق بين الجانبين.تساعد هذه الآلية في تقليل الرموز التي تم إنشاؤها مرارا وتكرارا لمجموعة متنوعة من المهام.نتائج التقييم على مجموعات بيانات توليد الترجمة والاستجابة المتاحة للجمهورية توضح فعالية اقتراحنا.
نقدم DynaBench، وهي منصة مفتوحة المصدر لإنشاء مجموعة البيانات الديناميكية ومعيار النموذج.يعمل Dynabench في متصفح ويب ويدعم إنشاء DataSet Indictet من الإنسان والنموذج في الحلقة: يسعى المحلقون إلى إنشاء أمثلة سيتطلب من النموذج المستهدف، لكن شخص آخر لن يفعله.في هذه الورقة، نجرب أن Dynabench يعالج حاجة حاسمة في مجتمعنا: تحقق النماذج المعاصرة بسرعة الأداء المتميز على المهام القياسية ولكن مع ذلك فشلت في أمثلة التحدي البسيطة وتعثرت في سيناريوهات العالم الحقيقي.من خلال Dynabench، يمكن إنشاء DataSet، تطوير النموذج، وتقييم النماذج إبلاغ بعضها البعض مباشرة، مما يؤدي إلى معايير أكثر قوة وغنية بالمعلومات.نقوم بالإبلاغ عن أربع مهام NLP الأولي، مما يوضح هذه المفاهيم وتسليط الضوء على وعد المنصة، ومعالجة الاعتراضات المحتملة على المعايير الديناميكية كمعيار جديد للحقل.
المحولات هي شبكة عصبية مقرها الانتباه، والتي تتكون من اثنين من المواد الغذائية، وهي شبكة انتباه الذات (SAN) وشبكة الأعلاف إلى الأمام (FFN). يستكشف البحوث الحالية لتعزيز اثنين من الطبقة الفرعية بشكل منفصل لتحسين القدرة على محول تمثيل النص. في هذه الور قة، نقدم فهما جديدا للسان و FFN كشبكات انتباه قناع (مان) وإظهار أنهم حالتان خاصتان من مانتين مع مصفوفات قناع ثابت. ومع ذلك، فإن مصفوفات قناع ثابتة الحد من القدرة على نمذجة النمذجة في مجال التمثيل النصي. لذلك نقدم طبقة جديدة تسمى شبكة انتباه قناع ديناميكي (DMAN) مع مصفوفة قناع يمكن أن تكون قادرة على نموذج الحزين على التكيف. لتضمين مزايا DMAN و San و FFN، نقترح بنية طبقية متسلسلة للجمع بين الأنواع الثلاثة من الطبقات. تجارب شاملة على المهام المختلفة، بما في ذلك الترجمة العصبية لترجمة الآلات والرسوم النصية توضح أن نموذجنا يتفوق على المحول الأصلي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا