ترغب بنشر مسار تعليمي؟ اضغط هنا

التعليمات الذاتية: محاذاة نموذج اللغة مع التعليمات الذاتية

Self-Instruct: Aligning Language Model with Self Generated Instructions

649   1   0   0.0 ( 0 )
 نشر من قبل arxiv كتاب
 تاريخ النشر 2022
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

النماذج اللغوية الكبيرة "المضبوطة للتعليمات" (التي تم ضبطها للاستجابة للتعليمات) قد أظهرت قدرة ملحوظة على التعميم بدون أي تدريب في مهام جديدة. ومع ذلك، فإنها تعتمد بشدة على بيانات التعليمات المكتوبة بواسطة الإنسان والتي تكون محدودة في الكمية والتنوع والإبداع، مما يعيق عملية التعميم للنموذج المضبوط. نقدم "Self-Instruct"، وهو إطار عمل لتحسين قدرات اتباع التعليمات لنماذج اللغة المدربة مسبقًا عن طريق الاستفادة من توليداتها الخاصة. يقوم خط أنابيبنا بتوليد عينات من التعليمات والإدخال والإخراج من نموذج اللغة، ثم يقوم بتقليصها قبل استخدامها لضبط النموذج الأصلي. باستخدام طريقتنا على GPT3 الأساسية، نظهر تحسينًا مطلقًا بنسبة 33٪ على نموذج Super-NaturalInstructions الأصلي، وهو متوافق مع أداء InstructGPT_001، والذي يتم تدريبه باستخدام بيانات مستخدم خاصة وتعليمات بشرية. لتقييم أعمق، نحن نضع مجموعة من التعليمات المكتوبة من قبل خبراء للمهام الجديدة، ونظهر من خلال التقييم البشري أن ضبط GPT3 باستخدام Self-Instruct يفوق استخدام مجموعات بيانات التعليمات العامة الموجودة حاليًا بفارق كبير، ولا يترك سوى فجوة بنسبة 5٪ خلف InstructGPT_001. يوفر Self-Instruct طريقة تقريبًا خالية من التعليقات لمزامنة نماذج اللغة المدربة مسبقًا مع التعليمات، ونحن نطلق مجموعة بيانات اصطناعية كبيرة لتسهيل الدراسات المستقبلية حول ضبط التعليمات.


ملخص البحث
تقدم الورقة البحثية إطار عمل يسمى SELF-INSTRUCT لتحسين قدرات النماذج اللغوية المدربة مسبقًا على اتباع التعليمات من خلال استخدام إشارات تعليمية يتم توليدها ذاتيًا. يتضمن الإطار عملية تكرارية تبدأ بمجموعة صغيرة من التعليمات المكتوبة يدويًا، ثم يتم استخدام النموذج اللغوي لتوليد تعليمات جديدة ومثيلات مدخلات ومخرجات لها. يتم تنقية هذه التعليمات والمثيلات قبل استخدامها لتدريب النموذج الأصلي. تُظهر النتائج أن النموذج المدرب باستخدام SELF-INSTRUCT يتفوق بشكل كبير على النموذج الأصلي ويقترب من أداء النماذج المدربة باستخدام بيانات تعليمات مكتوبة يدويًا ومكلفة. يتميز الإطار بقدرته على توليد مجموعة كبيرة ومتنوعة من التعليمات مع تقليل الاعتماد على البيانات المكتوبة يدويًا، مما يجعله طريقة فعالة لتحسين نماذج اللغة المدربة مسبقًا على اتباع التعليمات.
قراءة نقدية
تُعد ورقة SELF-INSTRUCT إضافة قيمة لمجال معالجة اللغة الطبيعية، حيث تقدم طريقة مبتكرة لتحسين أداء النماذج اللغوية في اتباع التعليمات. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، تعتمد الطريقة بشكل كبير على جودة النموذج اللغوي المستخدم في البداية، مما قد يحد من فعالية الإطار في حالة استخدام نماذج أقل كفاءة. ثانيًا، قد تواجه الطريقة تحديات في التعامل مع التعليمات غير الشائعة أو الإبداعية التي قد لا تكون ممثلة بشكل جيد في بيانات التدريب الأصلية. أخيرًا، هناك حاجة لمزيد من الدراسات لفهم تأثير حجم النموذج والمعلمات الأخرى على أداء الإطار. على الرغم من هذه التحديات، تُعد SELF-INSTRUCT خطوة مهمة نحو تحسين نماذج اللغة المدربة مسبقًا على اتباع التعليمات بطرق أكثر فعالية وأقل تكلفة.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من إطار SELF-INSTRUCT؟

    الهدف الرئيسي من إطار SELF-INSTRUCT هو تحسين قدرات النماذج اللغوية المدربة مسبقًا على اتباع التعليمات من خلال استخدام إشارات تعليمية يتم توليدها ذاتيًا وتقليل الاعتماد على البيانات المكتوبة يدويًا.

  2. كيف يتم توليد التعليمات الجديدة في إطار SELF-INSTRUCT؟

    يتم توليد التعليمات الجديدة في إطار SELF-INSTRUCT من خلال نموذج لغوي يتم تحفيزه باستخدام مجموعة صغيرة من التعليمات المكتوبة يدويًا، ثم يتم تنقية التعليمات والمثيلات الناتجة قبل استخدامها لتدريب النموذج الأصلي.

  3. ما هي الفوائد الرئيسية لاستخدام SELF-INSTRUCT مقارنة بالطرق التقليدية؟

    الفوائد الرئيسية لاستخدام SELF-INSTRUCT تشمل تحسين أداء النماذج اللغوية في اتباع التعليمات، تقليل الاعتماد على البيانات المكتوبة يدويًا والمكلفة، وتوفير طريقة فعالة لتوليد مجموعة كبيرة ومتنوعة من التعليمات.

  4. ما هي التحديات المحتملة التي قد تواجه إطار SELF-INSTRUCT؟

    التحديات المحتملة تشمل الاعتماد على جودة النموذج اللغوي المستخدم في البداية، صعوبة التعامل مع التعليمات غير الشائعة أو الإبداعية، والحاجة لمزيد من الدراسات لفهم تأثير حجم النموذج والمعلمات الأخرى على أداء الإطار.


المراجع المستخدمة
ﻻ يوجد مراجع
قيم البحث

اقرأ أيضاً

بالنسبة لأي موقع على شبكة الإنترنت للتجارة الإلكترونية، فهذا مشكلة غير خيالية تبني الإعلانات الدائمة التي تجذب المتسوقين.من الصعب اجتياز شريط الجودة الإبداعي للموقع، خاصة على نطاق واسع.وبالتالي نقترح حل برنامجي لتوليد عناوين إعلانات المنتج باستخدام م حتوى البيع بالتجزئة.نقترح حالة من التطبيقات الفنية لطرق التدرج في سياسة التعلم (RL) على المحولات (Vaswani et al.، 2017) نماذج لغة ملثم مقرها (ديفلين وآخرون، 2019).تقوم طريقةنا بإنشاء العنوان الإعلاني من خلال تكييف مشترك على منتجات متعددة يرغب البائع في الإعلان.نوضح أن أسلوبنا تتفوق على أساليب المحولات الحالية و LSTM + RL في مقاييس تداخل وتدقيق الجودة.نظهر أيضا أن عناويننا النموذجية التي تم إنشاؤها تفوقت عناوين حقوق الإنسان المقدمة من حيث القواعد الناقدية والجودة الإبداعية على النحو المحدد بالتدقيق.
أصبح استخدام آليات الاهتمام في أساليب التعلم العميق شعبية في معالجة اللغة الطبيعية بسبب أدائه المعلقة. يسمح باستخدام هذه الآليات إلى إحدى الأهمية لإدارة أهمية عناصر التسلسل وفقا لسياقها، ومع ذلك، فقد تمت ملاحظتها هذه الأهمية بشكل مستقل بين أزواج عناص ر التسلسل (اهتمام الذات) وبين مجال تطبيق التسلسل (الاهتمام السياقي)، مما يؤدي إلى فقد المعلومات ذات الصلة والحد من تمثيل التسلسلات. لمعالجة هذه القضايا الخاصة هذه نقترح آلية الاهتمام الذاتي الذاتي، والتي تتداول قبالة القيود السابقة، من خلال النظر في العلاقات الداخلية والسياقية بين عناصر التسلسل. تم تقييم الآلية المقترحة في أربع مجموعات قياسية لتحقيق مهمة تحديد اللغة المسيئة لتحقيق النتائج المشجعة. تفوقت على آليات الاهتمام الحالية وأظهرت أداء تنافسي فيما يتعلق بالنهج الحديثة من بين الفن.
لعنف الأسري وعلاقته بتقدیر الذات لدى طلاب التعلیم العالي: إذ لاحظت الباحثة من خلال عملها كمرشد اجتماعي لهذه الفئة التي تقدرها الباحثة من 14 سنة فما فوق إن بعض الطلاب لا یشعرون بقیمة ذواتهم أو أنهم مترددون في اتخاذ قراراتهم ولا یثقون في أنفسهم وأنه م عنیفین في سلوكهم الاجتماعي. لذلك جاءت مشكلة الدراسة: هل توجد علاقة بین العنف الأسري وتقدیر الذات لدى هؤلاء الطلاب؟ وجاءت أهمیة الدراسة في تقدیم معلومات عن علاقة العنف الأسري وتقدیر الذات كما أنها تعتبر إضافة جدیدة لبعض الدراسات التي تناولت علاقة العنف بتقدیر الذات لشریحة اجتماعیة مهمة وهي طلاب التعلیم العالي. ثم جاءت أهداف الدراسة في تحدید العلاقة بین العنف الأسري وتقدیر الذات وتحدید الفروق الفردیة للعنف الأسري تبعاً للنوع وتحدید العلاقة بین العنف الأسري والمستوى التعلیمي للقائم بالرعایة وتحدید المستوى الاقتصادي وعلاقته بوجود العنف وعلاقة حجم الأسرة بوجود العنف الأسري. تكونت عینة الدراسة من 70 طالب وطالبة للمترددین على العیادات الإرشادیة، مستخدمة أداة الاستبیان لجمع وتحلیل البیانات والوصول من خلالها إلى أهم النتائج المرتبطة بها ومن أهم النتائج: 1 .توجد علاقة بین العنف الأسري وتقدیر الذات لدى طلاب التعلیم العالي. 2 .توجد فروق فردیة للعنف الأسري تبعاً للنوع. 3 .توجد علاقة بین العنف الأسري ومستوى التعلیم للقائم بالرعایة 4 .عدم وجود علاقة بین المستوى الاقتصادي للأسرة ووجود العنف الأسري. 5 .عدم وجود علاقة بین حجم الأسرة ووجود العنف الأسري. أهم توصیات الدراسة: على الوالدین أن یكونا على وعي تام بلذواتهما وتقدیرهما لما له من بالغ الأهمیة في نمو مفهوم سوي عن اللذات لدى أبنائهما وعلیهما أن یعملا على تنمیة اتجاهات إیجابیة لدى أبنائهما حتى یستطیعا أن یتقبلا أنفسهما ویقدراها ویثقا بها.
حقق نماذج اللغة المدربة مسبقا بشكل جيد (LMS) نجاحا هائلا في العديد من مهام معالجة اللغة الطبيعية (NLP)، لكنها لا تزال تتطلب بيانات مفرطة الحجم في مرحلة ضبط الدقيقة. ندرس مشكلة LMS المدبرة مسبقا باستخدام إشراف ضعيف فقط، دون أي بيانات معدنية. هذه المشك لة تحديا لأن قدرة LMS عالية تجعلها عرضة للاحتفاظ بالملصقات الصاخبة الناتجة عن إشراف ضعيف. لمعالجة هذه المشكلة، نحن نطور إطارا للتدريب الذاتي للتناقض، جيب التمام، لتمكين LMS الرصيف مع إشراف ضعيف. تدعمه التنظيم البسيط والنعيد القائم على الثقة، فإن إطار عملائنا يحسن تدريجيا من تركيب النموذج مع قمع انتشار الأخطاء بشكل فعال. تشير التجارب على التسلسل، الرمز المميز، ومهام تصنيف زوج الزوج الحكم إلى أن نموذجنا يتفوق على أقوى خط أساس عن طريق الهوامش الكبيرة وتحقق أداء تنافسي مع أساليب ضبط صاخبة بالكامل. تنفيذنا متاح على https://github.com/yueyu1030/cosine.
إن توفير نماذج اللغة المحددة مسبقا مع أوصاف مهمة بسيطة في اللغة الطبيعية تمكنهم من حل بعض المهام بطريقة غير منشأة بالكامل. علاوة على ذلك، عند دمج التعلم المنتظم من الأمثلة، فإن هذه الفكرة تنتج نتائج قليلة رائعة لمجموعة واسعة من مهام تصنيف النص. كما أ نه اتجاه واعد في تحسين كفاءة البيانات في الإعدادات الاسرد، ولكن هناك العديد من التحديات لاستخدام مزيج من أوصاف المهام والتعلم القائم على المثال لتوليد النص. على وجه الخصوص، من الأهمية بمكان العثور على أوصاف المهام سهلة الفهم للنموذج المحدد مسبقا وتأكد من أنه يستخدم بالفعل منهم؛ علاوة على ذلك، يجب تنفيذ تدابير فعالة ضد التجاوز. في هذه الورقة، نظير على كيفية معالجة هذه التحديات: نقدم Genet، وهي طريقة للجيل النصي الذي يستند إلى تدريب استغلال النمط، وهو نهج حديث للجمع بين التعليمات النصية مع التعلم الإشراف الذي يعمل فقط من أجل تصنيف المهام. في العديد من مجموعات بيانات التلخيص وجيل النتائج، تقدم Genet تحسينات متسقة على خطوط خطوط خطوط خطوط خطوط قليلة في إعدادات قليلة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا