ترغب بنشر مسار تعليمي؟ اضغط هنا

تقييم التناسقات الواقعية المحبوسة

Fine-grained Factual Consistency Assessment for Abstractive Summarization Models

350   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تتضارنات واقعية موجودة في إخراج نماذج تلخيص مبادرة مع المستندات الأصلية تم تقديمها بشكل متكرر. يتطلب تقييم تناسق الحقائق إمكانية التفكير في العثور على أدلة خفية لتحديد ما إذا كان ملخص النموذج الذي تم إنشاؤه يتوافق مع المستند الأصلي. تقترح هذه الورقة إطار تقييم حقائق من الفصحتين على مرحلتين على مرحلتين نماذج تلخيص (Sumfc). بالنظر إلى وثيقة الجملة الموجزة، في المرحلة الأولى، حدد Sumfc الجمل الأكثر صلة بالجمل الأكثر صلة مع الجملة الموجزة من المستند. في المرحلة الثانية، ينفذ النموذج منطق اتساق محمظ بشكل جيد على مستوى الجملة، ثم يعزى جميع درجات الاتساق لجميع الجمل للحصول على نتيجة التقييم النهائي. نحصل على أزواج البيانات التدريبية عن طريق تخليق البيانات واعتماد فقدان مقاوم للتناقض لأزواج البيانات لمساعدة النموذج على تحديد العظة خفية. تظهر نتائج التجربة أن Sumfc قد أحدث تحسنا كبيرا على الأساليب السابقة للدولة السابقة. تشير تجاربنا أيضا إلى أن Sumfc يميز الاختلافات المفصلة بشكل أفضل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

اكتسبت أنظمة تلخيص الجماع العصبي تقدما كبيرا في السنوات الأخيرة.ومع ذلك، غالبا ما تنتج تلخيص التلوث في كثير من الأحيان بيانات غير متناسقة أو حقائق كاذبة.كيفية توليد الملخصات التجريدية بشكل كبير تلقائيافي هذه الورقة، اقترحنا نهجا فعالا معزز بيانات تكب ير البيانات الفعالة لتشكيل مجموعة بيانات الاتساق الواقعية.بناء على مجموعة البيانات الاصطناعية، ندرب نموذجا للتقييم التي لا يمكن أن تجعل تمييز التناسق الواقعي الدقيق والقوي فحسب، بل قادرا أيضا على جعل الأخطاء الواقعية القابلة للتفسير تتبعها توزيع التدرج السابق على توزيع الرمز المميز.توضح إجراء التجارب والتحليل في ملخصات التلخيص المشروح العام ومجموعات بيانات الاتساق واقعية نهجنا فعال ومعقول.
تم العثور على ملخصات إطفاء التلقائي في كثير من الأحيان تشويه الحقائق أو اختصاصها في المقال.هذا التناقض بين الملخص والنص الأصلي قد أثر بشكل خطير على قابليته للتطبيق.نقترح نموذج تلخيص الحقائق FASUM لاستخراج ودمج العلاقات الواقعية في عملية توليد الموجز عبر انتباه الرسم البياني.ثم نقوم بتصميم نموذج مصحح واقعي FC لتصحيح الأخطاء الواقعية تلقائيا من الملخصات الناتجة عن الأنظمة الحالية.تظهر النتائج التجريبية أن تلخيص حقائق الحقائق يمكن أن تنتج ملخصات إخراج مع اتساق واقعي أعلى مقارنة بالنظام الحالي، ونموذج التصحيح يحسن الاتساق الواقعي الملخصات المعطاة عن طريق تعديل عدد قليل فقط من الكلمات الرئيسية.
المعرفة الواقعية المكتسبة أثناء التدريب المسبق وتخزينها في معلمات نماذج اللغة (LMS) يمكن أن تكون مفيدة في مهام المصب (على سبيل المثال، الإجابة على السؤال أو الاستدلال النصي). ومع ذلك، يمكن أن تسبب بعض الحقائق أو تصبح عفا عليها الزمن مع مرور الوقت. نق دم المعلمين، وهي طريقة يمكن استخدامها لتحرير هذه المعرفة، وبالتالي إصلاح الأخطاء أو التنبؤات غير المتوقعة دون الحاجة إلى إعادة تدريب مكلفة أو ضبط جيد. إلى جانب كونها فعالة بشكل حسابي، لا تتطلب المعرفة المعرفة أي تعديلات في LM قبل التدريب (على سبيل المثال، استخدام التعلم التلوي). في نهجنا، نحن ندرب شبكة فرط بتحسين مقيد لتعديل حقيقة دون التأثير على بقية المعرفة؛ ثم يتم استخدام شبكة Hyper المدربة للتنبؤ بتحديث الوزن في وقت الاختبار. نعرض فعالية المعرفة مع اثنين من المهندسينيات الشائعة ومهام المعرفة المكثفة: ط) نموذج بيرت يتم ضبطه بشكل جيد لفحص الحقائق، والثاني) نموذج بارت تسلسل إلى تسلسل للرد على السؤال. من خلال طريقتنا، يميل تغيير التنبؤ بشأن الصياغة المحددة لاستعلامه إلى تغيير متسق في التنبؤ أيضا بصيادتها. نظرا لأن هذا يمكن تشجيعه بشكل أكبر من خلال استغلال الصياغة (على سبيل المثال، التي تم إنشاؤها تلقائيا) أثناء التدريب. ومن المثير للاهتمام، أن شبكة فرط لدينا يمكن اعتبارها مسبار "تكشف عن مكونات يجب تغييرها لمعالجة المعرفة الواقعية؛ يوضح تحليلنا أن التحديثات تميل إلى التركيز على مجموعة فرعية صغيرة من المكونات. شفرة المصدر المتاحة في https://github.com/nicola-decao/knowegleditor
تصف الورقة نظام تلخيص تلقائي باللغة الإنجليزية لبيانات الأخبار عبر الإنترنت التي تأتي من لغات مختلفة غير الإنجليزية.تم تصميم النظام لاستخدامه في بيئة الإنتاج لمراقبة الوسائط.يمكن أن تكون التلخيص التلقائي مفيدة للغاية في هذا المجال عند تطبيقها كأداة م ساعد للصحفيين حتى يتمكنوا من مراجعة المعلومات المهمة فقط من قنوات الأخبار.ومع ذلك، مثل كل حل البرمجيات، يحتاج الملخص التلقائي إلى مراقبة الأداء والبيئة الآمنة المؤمنة للعملاء.في بيئة مراقبة وسائل الإعلام هي أكثر السمات إشكالية يجب معالجتها هي: قضايا حقوق الطبع والنشر، الاتساق الواقعي، أسلوب النص والمعايير الأخلاقية في الصحافة.وبالتالي، فإن المساهمة الرئيسية لعملنا الحالي هي أن الخصائص المذكورة أعلاه مراقبة بنجاح في نماذج تلخيص تلقائية عصبية وتحسينها بمساعدة إجراءات التحقق من الصحة والحفاظ على الحقائق وفحص الحقائق.
في حين أن التلخيص المبشط في بعض اللغات، مثل اللغة الإنجليزية، فقد وصلت بالفعل نتائج جيدة إلى حد ما بسبب توفر موارد تحديد الاتجاه، مثل مجموعة بيانات CNN / Daily Mail، والتقدم الكبير في النماذج العصبية الإنتاجية، والتقدم المحرز في تلخيص الجماع للعربية اللغة الخامسة الأكثر تكلم على مستوى العالم، لا تزال في أحذية الأطفال. في حين أن بعض الموارد لتلخيص الاستخراجي كانت متاحة لبعض الوقت، في هذه الورقة، نقدم أول كائن من ملخصات الأخبار المذهلة التي كتبها الإنسان باللغة العربية، على أمل وضع أساس هذا الخط من البحث لهذه اللغة الهامة. تتكون DataSet من أكثر من 21 ألف عنصر. استخدمنا هذه البيانات هذه البيانات لتدريب مجموعة من أنظمة تلخيص الجماع العصبي للعربية من قبل طرازات اللغة المدربة مسبقا مسبقا مثل بيرت متعددة اللغات وأرابيرت والفتنة متعددة اللغات - 50. كما مجموعة البيانات العربية أصغر بكثير من .g. DataSet CNN / Daily Mail DataSet، كما طبقنا نقل المعرفة عبر اللغات إلى تحسين أداء أنظمةنا الأساسية. تضمنت الإعدادات نماذج ملخصتين تعتمد على M-Bert تدرب أصلا على الهنغارية / الإنجليزية ونظام مماثل على أساس M-BART-50 مدربا أصلا للروسية التي تم ضبطها بشكل جيد للعربية. تم إجراء تقييم النماذج من حيث الحمر، وتم تقييم يدوي للطلاقة وكفاية النماذج أيضا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا