أوراق بحثية, رسائل ماجستير ودكتوراه منشورة من قبل arxiv

التعليمات الذاتية: محاذاة نموذج اللغة مع التعليمات الذاتية

1203 - arxiv 2022 كتاب

النماذج اللغوية الكبيرة "المضبوطة للتعليمات" (التي تم ضبطها للاستجابة للتعليمات) قد أظهرت قدرة ملحوظة على التعميم بدون أي تدريب في مهام جديدة. ومع ذلك، فإنها تعتمد بشدة على بيانات التعليمات المكتوبة بواسطة الإنسان والتي تكون محدودة في الكمية والتنوع والإبداع، مما يعيق عملية التعميم للنموذج المضبوط. نقدم "Self-Instruct"، وهو إطار عمل لتحسين قدرات اتباع التعليمات لنماذج اللغة المدربة مسبقًا عن طريق الاستفادة من توليداتها الخاصة. يقوم خط أنابيبنا بتوليد عينات من التعليمات والإدخال والإخراج من نموذج اللغة، ثم يقوم بتقليصها قبل استخدامها لضبط النموذج الأصلي. باستخدام طريقتنا على GPT3 الأساسية، نظهر تحسينًا مطلقًا بنسبة 33٪ على نموذج Super-NaturalInstructions الأصلي، وهو متوافق مع أداء InstructGPT_001، والذي يتم تدريبه باستخدام بيانات مستخدم خاصة وتعليمات بشرية. لتقييم أعمق، نحن نضع مجموعة من التعليمات المكتوبة من قبل خبراء للمهام الجديدة، ونظهر من خلال التقييم البشري أن ضبط GPT3 باستخدام Self-Instruct يفوق استخدام مجموعات بيانات التعليمات العامة الموجودة حاليًا بفارق كبير، ولا يترك سوى فجوة بنسبة 5٪ خلف InstructGPT_001. يوفر Self-Instruct طريقة تقريبًا خالية من التعليقات لمزامنة نماذج اللغة المدربة مسبقًا مع التعليمات، ونحن نطلق مجموعة بيانات اصطناعية كبيرة لتسهيل الدراسات المستقبلية حول ضبط التعليمات.

معالجة اللغات الطبيعية ChatGPT نماذج اللغة الضخمة

توقعات كأس العالم فيفا ٢٠١٨, نموذج يستخدم الغابات العشوائية مع توظيف بارامترات تقديرية لقدرات الفريق

2995 - arxiv 2018 ورقة بحثية

في هذا البحث, نقارن ثلاثة طرق نمذجة أهداف مباريات كرة القدم مع الأخذ بعين الاعتبار الأداء المتنبئ به اعتمادا على جميع المباريات في كؤوس الفيفا الأربعة السابقة 2002--2014: نماذج الانحدار بواسون, طرق الغابات العشوائية, وطرق الترتيب.

Machine learning Prediction FIFA WORLD CUP 2018 Random Forests

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد