ترغب بنشر مسار تعليمي؟ اضغط هنا

يكتب مطورو البرمجيات الكثير من التعليمات البرمجية المصدر والوثائق أثناء تطوير البرمجيات. جوهريا، غالبا ما يتذكر المطورون أجزاء من شفرة المصدر أو ملخصات التعليمات البرمجية التي كتبوها في الماضي أثناء تنفيذ البرامج أو توثيقها. لتقليل رمز المطور أو سلوك الجيل الموجز، نقترح إطارا معدليا استرجاعا، ريدكودر، الذي يسترد الكود أو الملخصات ذات الصلة من قاعدة بيانات استرجاع ويوفر لهم كملحق لجيل التعليمات أو نماذج التلخيص. ريدكودر لديه زوجين من التفرد. أولا، إنه يمتد تقنية استرجاع حديثة كثيفة الاستخدام للبحث عن التعليمات البرمجية أو الملخصات ذات الصلة. ثانيا، يمكن أن تعمل مع قواعد بيانات استرجاع تشمل Unimodal (رمز فقط أو وصف اللغة الطبيعية) أو مثيلات BIMODAL (أزواج الكود الوصف). نقوم بإجراء تجارب وتحليل مكثف على مجموعة بيانات قياسية لتوليد التعليمات البرمجية والتلخيص في جاوة وبيرثون، والنتائج الواعدة تؤيد فعالية الإطار المعزز المقترح لاسترجاعنا.
هل يمكن لصق Bert مدربة مسبقا بلغة واحدة و GPT لآخر لترجمة النصوص؟يؤدي التدريب للإشراف على الذات باستخدام بيانات أحادية الأونلينغ فقط إلى نجاح نماذج اللغة المدربة مسبقا (ملثمين) في العديد من مهام NLP.ومع ذلك، فإن ربط بيرت مباشرة كتشفير و GPT حيث أن وح دة فك ترميز يمكن أن يكون تحديا في الترجمة الآلية، وفصول النماذج التي تشبه gpt إلى مكون متقاطع مكون مطلوب في فك تشفير SEQ2SEQ.في هذه الورقة، نقترح Graformer إلى الكسب غير المشروع نماذج اللغة المدربة مسبقا (ملثمين) للترجمة الآلية.مع بيانات أحادية الأبعاد لبيانات التدريب المسبق والتوازي لتدريب تطعيم، نستفيد إلى حد ما من استخدام كلا النوعين من البيانات.تظهر التجارب في 60 اتجاهات أن طريقتنا تحقق متوسط التحسينات من 5.8 بلو في X2EN و 2.9 بلو في اتجاهات EN2X مقارنة مع المحول متعدد اللغات من نفس الحجم.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا