ترغب بنشر مسار تعليمي؟ اضغط هنا

FID-ex: تحسين نماذج التسلسل إلى التسلسل لتوليد الأساس المنطقي الاستخراج

FiD-Ex: Improving Sequence-to-Sequence Models for Extractive Rationale Generation

258   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تكتسب توضيحات اللغة الطبيعية (NL) من التنبؤات النموذجية شعبية كوسيلة لفهم القرارات والتحقق منها من قبل النماذج المدربة مسبقا كبيرة من الصندوق الأسود، للمهام مثل الإجابة على الأسئلة (QA) والتحقق من الحقائق. مؤخرا، أثبتت التسلسل المدرب مسبقا إلى نماذج التسلسل (SEQ2SEQ) أن تكون فعالة للغاية في اتخاذ التنبؤ المشترك، بالإضافة إلى توليد تفسيرات NL. ومع ذلك، هذه النماذج لديها العديد من أوجه القصور؛ يمكنهم تصنيع توضيحات حتى بالنسبة للتنبؤات غير الصحيحة، فمن الصعب التكيف مع مستندات الإدخال الطويلة، وتتدرب تدريبها كمية كبيرة من البيانات المسمى. في هذه الورقة، نطور FID-EX، والتي تعالج هذه العيوب لنماذج SEQ2SeQ بقلم: 1) إدخال علامات جملة للقضاء على تلفيق التفسير من خلال تشجيع الجيل الاستخراجي، 2) باستخدام بنية الانصهار في وحدة فك التشفير للتعامل مع سياقات الإدخال الطويلة، و 3) توسيط الصغار على ضبط مجموعات بيانات QA المجال المفتوحة المهيكلة لتحسين أداء القليل من الطلقات. تحسن FID-السابقين بشكل كبير على العمل السابق من حيث مقاييس التفسير ودقة المهام على خمس مهام من المعيار لشرح الممحاة في كل من إعدادات الإشراف بالكامل وعدد القليلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

حققت نماذج التسلسل العصبي غير المعروضة أداء تنافسية مع نماذج التسلسل الموجهة للحكومة الموجهة التي تولد رتيبا من اليسار إلى اليمين في مهام الترجمة الآلية. في هذا العمل، ندرب السياسة التي تتعلم طلب الجيل لنموذج الترجمة المدربة مسبقا مسبقا، عبر التعلم ا لتعزيز. نظا على أن الترجمات التي تركتها أوامرنا المستفادة تحقق درجات بلو أعلى من النواتج المشفرة من اليسار إلى اليمين أو فك شفرة من قبل النظام المستفيد من منصيموف وآخرون. (2019) على مهمة الترجمة الألمانية والإنجليزية WMT'14. فيما يتعلق بالأمثلة بأقصى قدر من المصدر والمستهدف لمدة 30 من المهام الإنجليزية من DE-en و WMT'16 الإنجليزية الرومانية، فإن أمرنا المستفيد يتفوق على جميع أوامر الجيل المجهرية على ثلاثة من أربع أزواج لغوية. نقوم بالتحليل بعناية أنماط الطلب المستفادة من خلال التحليل النوعي والكمي. نظهر أن سياستنا تتبع عموما طلبا خارجيا إلى داخلي، توقع أكثر الأيسر والأيمن - معظم المناصب أولا، ثم تتحرك نحو المنتصف أثناء تخطي الكلمات الأقل أهمية في البداية. علاوة على ذلك، فإن السياسة تتوقع عادة مواقع لهيكل مؤسس بنزلي واحد في خطوات متتالية. نعتقد أن نتائجنا قد توفر المزيد من الأفكار حول آلية نماذج الجيل غير المعردة وتشجيع المزيد من البحث في هذا الاتجاه.
تم تطبيق نماذج التسلسل إلى التسلسل على مجموعة واسعة من مهام NLP، ولكن كيفية استخدامها بشكل صحيح لتتبع حالة الحوار بشكل منهجي. في هذه الورقة، ندرس هذه المشكلة من وجهات نظر أهداف ما قبل التدريب وكذلك تنسيقات تمثيلات السياق. نوضح أن اختيار الهدف ما قبل التدريب يجعل فرقا كبيرا لجودة تتبع الدولة. على وجه الخصوص، نجد أن التنبؤ الأمان المقنع هو أكثر فعالية من نمذجة اللغة التراجع التلقائي. نستكشف أيضا استخدام Pegasus، وهو هدف ما قبل التدريب المستندة إلى التنبؤ بتلخيص النص، لنموذج تتبع الدولة. وجدنا أن التدريب المسبق لمهمة التلخيص البعيدة على ما يبدو يعمل بشكل جيد بشكل جيد لتتبع حالة الحوار. بالإضافة إلى ذلك، وجدنا أنه في حين أن تمثيل سياق الدولة المتكرر يعمل أيضا بشكل جيد بشكل معقول، فقد يكون للنموذج صعوبة في التعافي من الأخطاء السابقة. أجرينا تجارب في مجموعات بيانات MultiWoz 2.1-2.4 و Woz 2.0 و DSTC2 مع ملاحظات متسقة.
النمذجة المتنقلة المتسلسلة قوية هي مهمة أساسية في العالم الحقيقي حيث تكون المدخلات صاخبة في كثير من الأحيان. تحتوي المدخلات التي تم إنشاؤها عن المستخدمين والآلة على أنواع مختلفة من الضوضاء في شكل أخطاء إملائية، والأخطاء النحوية، وأخطاء التعرف على الأ حرف، والتي تؤثر على مهام المصب وتأثر على الترجمة الشفوية للنصوص. في هذا العمل، نرتند بنية جديدة للتسلسل إلى التسلسل للكشف عن وتصحيح مختلف العالم الحقيقي والضوضاء الاصطناعية (هجمات الخصومة) من النصوص الإنجليزية. نحو ذلك اقترحنا بنية فك التشفير المعدلة التي تعتمد على المحولات التي تستخدم آلية Gating للكشف عن أنواع التصحيحات المطلوبة وبناء على تصحيح النصوص. تظهر النتائج التجريبية أن الهندسة المعمارية المصورة لدينا مع نماذج لغوية مدربة مسبقا تؤدي بشكل أفضل بشكل كبير إلى أن النظيرات غير الدائرين ونماذج تصحيح الأخطاء الأخرى غير المدرجة في تصحيح الأخطاء الإملائية والحدائية. التقييم الخارجي لنموذجنا على الترجمة الآلية (MT) ومهام التلخيص تظهر الأداء التنافسي للنموذج مقابل نماذج تسلسل تسلسل أخرى أخرى تحت المدخلات الصاخبة.
الأساليب نهاية إلى نهاية لمهام التسلسل أصبحت شعبية بشكل متزايد. ومع ذلك بالنسبة لمهام التسلسل المعقدة، مثل ترجمة الكلام، فإن الأنظمة التي تتالي أن العديد من النماذج المدربة على المهام الفرعية قد أظهرت متفوقة، مما يشير إلى أن تكوين النظم المتتالية يبس ط التعلم وتمكين قدرات البحث المتطورة. في هذا العمل، نقدم إطارا نهاية إلى نهائي يستغل التركيز لتعلم التمثيلات المخفية القابلة للبحث في المراحل المتوسطة لنموذج التسلسل باستخدام المهام الفرعية المتحللة. يمكن تحسين هذه الوسيط المخفي باستخدام بحث الشعاع لتعزيز الأداء العام ويمكنه أيضا دمج النماذج الخارجية في المراحل المتوسطة للشبكة لإعادة النتيجة أو التكيف باتجاه بيانات خارج المجال. مثيل واحد من الإطار المقترح هو نموذج متعدد اللمعان لترجمة الكلام التي تستخرج الوسطيات المخفية القابلة للبحث عن مهمة فرعية للتعرف على الكلام. يوضح النموذج الفوائد المذكورة أعلاه وتفوق على الحالة السابقة من بين الفن من خلال +6 و +3 بلو على مجموعتي الاختبار من Fisher-Callhome وحوالي +3 و +4 بلو على اللغة الإنجليزية والألمانية والإنجليزية - مجموعات اختبار فرنسية من must-c.
خريطة العقل هي رسم تخطيطي يمثل المفهوم المركزي والأفكار الرئيسية بطريقة هرمية. سيؤدي تحويل النص العادي إلى خريطة ذهنية إلى الكشف عن هيكلها الدلالي الرئيسي وتكون أسهل في فهمه. بالنظر إلى وثيقة، تستخرج طريقة جيل خريطة العقل التلقائي الحالية علاقات كل ز وج جملة لتوليد الرسم البياني الدلالي الموجه لهذا المستند. تزداد تعقيد الحساب بشكل كبير مع طول الوثيقة. علاوة على ذلك، من الصعب التقاط الدلالات الإجمالية. للتعامل مع التحديات المذكورة أعلاه، نقترح شبكة جيل مخريطة العقل الفعالة تقوم بتحويل وثيقة إلى رسم بياني عبر الرسوم البيانية بالتسلسل إلى الرسم البياني. لضمان خريطة ذهنية ذات مغزى، نقوم بتصميم وحدة تحويل رسم بياني لضبط الرسم البياني العلاقة بطريقة تعليمية للتعزيز. تظهر النتائج التجريبية الواسعة أن النهج المقترح أكثر فعالية وكفاءة من الأساليب الحالية. يتم تقليل وقت الاستدلال بآلاف المرات مقارنة بالطرق الحالية. تتحقق دراسات الحالة أن خرائط العقل التي تم إنشاؤها بشكل أفضل تكشف عن الهياكل الدلالية الأساسية للوثيقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا