ترغب بنشر مسار تعليمي؟ اضغط هنا

توليد استرجاع قوي المعزز لملء فتحة صفرية

Robust Retrieval Augmented Generation for Zero-shot Slot Filling

408   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تظل تحفيز الرسوم البيانية المعرفة عالية الجودة عالية الجودة من مجموعة معينة من الوثائق مشكلة صعبة في منظمة العفو الدولية. تتمثل إحدى الطرق في إحدى الطرق في هذه المشكلة من خلال التقدم في مهمة ذات صلة تعرف باسم ملء الفتحة. في هذه المهمة، نظرا لاستعلام كيان في شكل [كيان أو فتحة، حاول الأعمال الأخيرة في الحقل حل هذه المهمة في أزياء نهاية إلى نهاية باستخدام نماذج اللغة المستندة إلى الاسترجاع. في هذه الورقة، نقدم نهجا جديدا لملء فتحة الصفر التي تستوعب الصفر الذي يمتد استرجاع المقطع الكثيف مع السلبيات الصعبة وإجراءات تدريب قوية لنماذج التوليد المعزز للاسترجاع. تقارير النموذج لدينا تحسينات كبيرة على كل من مجموعات بيانات ملء فتحة T-REX و ZSRE، وتحسين كلا من توليد استرجاع المقطع ونظام الفتحة، والترتيب في وضع أعلى 1 في لوحة المتصدرين KILT. علاوة على ذلك، نوضح متانة نظامنا في إظهار قدراته على تكيف نطاقه على متن عبارة عن مجموعة جديدة من مجموعة البيانات المشبوكة لملء الفتحة، من خلال مزيج من التعلم الصفر / قليل من الرصاص. نحن نفرج عن شفرة المصدر والنماذج المدربة مسبقا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يكتب مطورو البرمجيات الكثير من التعليمات البرمجية المصدر والوثائق أثناء تطوير البرمجيات. جوهريا، غالبا ما يتذكر المطورون أجزاء من شفرة المصدر أو ملخصات التعليمات البرمجية التي كتبوها في الماضي أثناء تنفيذ البرامج أو توثيقها. لتقليل رمز المطور أو سلوك الجيل الموجز، نقترح إطارا معدليا استرجاعا، ريدكودر، الذي يسترد الكود أو الملخصات ذات الصلة من قاعدة بيانات استرجاع ويوفر لهم كملحق لجيل التعليمات أو نماذج التلخيص. ريدكودر لديه زوجين من التفرد. أولا، إنه يمتد تقنية استرجاع حديثة كثيفة الاستخدام للبحث عن التعليمات البرمجية أو الملخصات ذات الصلة. ثانيا، يمكن أن تعمل مع قواعد بيانات استرجاع تشمل Unimodal (رمز فقط أو وصف اللغة الطبيعية) أو مثيلات BIMODAL (أزواج الكود الوصف). نقوم بإجراء تجارب وتحليل مكثف على مجموعة بيانات قياسية لتوليد التعليمات البرمجية والتلخيص في جاوة وبيرثون، والنتائج الواعدة تؤيد فعالية الإطار المعزز المقترح لاسترجاعنا.
تدرس هذه الورقة مهمة جيل تسييس الهدسة (KG) للسيناريوهات التي يلعب فيها الهيكل دورا مهما. على سبيل المثال، يتكون المنشور العلمي من عنوان قصير وجسم طويل، حيث يمكن استخدام العنوان لإلغاء التأكيد على التفاصيل غير المهمة في الجسم. وبالمثل، لوظائف وسائل ال تواصل الاجتماعي القصيرة (، تغريدات)، يمكن زيادة السياق النادر من الألقاب، على الرغم من أن غالبا ما تكون مفقودة. مساهمتنا هي توليد / زيادة الهيكل ثم حقن هذه المعلومات في الترميز، باستخدام أجهزة الرماية الحالية للمستندات الأخرى، تكمل عناوين مفقودة / غير كاملة. نقترحون نهج ترميز وثيقة المعزز في الهيكل الجديد تتكون من المراحل التالية: المرحلة الأولى، وهي توليد الهيكل، تمتد المستند المحدد بمخططات الرماية ذات الصلة ولكن غائبة، وتعزيز السياق المفقود. المرحلة الثانية، وهيكل الترميز، تقوم ببناء رسم بياني للمخططات الرائقية والوثيقة المعينة للحصول على تمثيل الهيكل المدرك للنص المعزز. تحقق نتائج التجريبية الخاصة بنا أن تكبير هيكلنا المقترح والترميز / فك التشفير المعزز يمكن أن يحسن كجم لكل من السيناريوهات، مما يتفوق على أحدث من الفن.
تشفير لغة متعددة اللغات المدربة مسبقا، مثل Bert متعدد اللغات و XLM-R، إظهار إمكانات كبيرة للتحويل الصفر - عبر اللغات. ومع ذلك، فإن هذه اللوائح متعددة اللغات لا تحيي بالتحديد الكلمات والعبارات عبر اللغات. على وجه الخصوص، يتطلب محاذاة التعلم في مساحة ا لتضمين متعددة اللغات عادة على مستوى الجملة أو المستوى الموازي على مستوى Word، وهي مكلفة يتم الحصول عليها لغات الموارد المنخفضة. بديل هو جعل التشفير متعددة اللغات أكثر قوة؛ عند ضبط التشفير باستخدام المهمة المصدرة للمهمة، نربط التشفير لتتسامح مع الضوضاء في المساحات التضمين السياقية بحيث لا تتماشى تمثيلات اللغات المختلفة بشكل جيد، لا يزال بإمكان النموذج تحقيق أداء جيد على الصفر بالرصاص عبر اللغات نقل. في هذا العمل، نقترح استراتيجية تعليمية لتدريب النماذج القوية عن طريق رسم الروابط بين الأمثلة الخصومة وحالات فشل النقل الصفرية عبر اللغات. نعتمد اثنين من أساليب التدريب القوية المستخدمة على نطاق واسع، والتدريب الخصوم والتنعيم العشوائي، لتدريب النموذج القوي المرغوب فيه. توضح النتائج التجريبية أن التدريب القوي يحسن نقل صفرية عبر اللغات على مهام تصنيف النص. التحسن هو أكثر أهمية في إعداد النقل المتبادل المعمم، حيث ينتمي زوج جمل المدخلات إلى لغتين مختلفة.
ينشأ التعلم القليل من الرصاص في سيناريوهات عملية مهمة، كما هو الحال عندما يحتاج نظام فهم اللغة الطبيعية إلى تعلم ملصقات دلالية جديدة للنشاط الناشئ والموارد النادر. في هذه الورقة، نستكشف الأساليب القائمة على استرجاع مهام تعبئة النوايا وملء الفتحات في إعدادات قليلة. تتكبد الأساليب المستندة إلى الاسترداد تنبؤات بناء على الأمثلة المسمى في مؤشر الاسترجاع مماثلة للمدخلات، وبالتالي يمكن أن تتكيف مع مجالات جديدة ببساطة عن طريق تغيير الفهرس دون الحاجة إلى إعادة تدريب النموذج. ومع ذلك، فمن غير تافهة لتطبيق هذه الأساليب على المهام مع مساحة تسمية معقدة مثل ملء الفتحة. تحقيقا لهذه الغاية، نقترح طريقة استرجاع مدفوعة المستوى التي تتعلم تمثيلات محكسية مماثلة للتمثيل مع نفس التسمية عبر هدف Softmax Batch-Softmax الرواية. في وقت الاستدلال، نستخدم ملصقات المسافات المستردة لبناء الهيكل النهائي بأعلى درجة التجميع. تتفوق طريقةنا على الأنظمة السابقة في مختلف إعدادات القليل من الطوائم على معايير Clinc and Senips.
تتطلب المهام الفرعية لتصنيف النية، مثل التواضع على تحول التوزيع، والتكيف مع مجموعات المستخدمين المعينة والتخصيص، والكشف خارج المجال، ومجموعات بيانات واسعة ومرنة للتجارب والتقييم.نظرا لأن جمع مجموعات البيانات هذه هي الوقت والمستهلك للعمل، نقترح استخدا م أساليب جيل النص لجمع البيانات.يجب تدريب المولد على توليد الكلام التي تنتمي إلى نية معينة.نستكشف مناهضين لتوليد الكلام الموجهين في المهام: في نهج الطلقة الصفرية، يتم تدريب النموذج على توليد الكلام من النوايا المشاهدة ويتم استخدامها أيضا لتوليد الكلام للمحاطة غير المرئية أثناء التدريب.في نهج طلقة واحدة، يتم تقديم النموذج مع كلام واحد من نية الاختبار.نحن نؤدي التقييم التلقائي الشامل والبشري للخصائص الجوهرية لنهج الجيلين.يتم تصنيف سمات البيانات التي تم إنشاؤها من مجموعات الاختبار الأصلية، التي تم جمعها عبر مصادر الحشد.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا