ترغب بنشر مسار تعليمي؟ اضغط هنا

التخطيط لمستوى الجملة لتلخيص إغراق خاصة

Sentence-level Planning for Especially Abstractive Summarization

274   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعتمد نماذج تلخيص الجماع بشكل كبير على آليات النسخ، مثل شبكة المؤشر أو الاهتمام، لتحقيق أداء جيد، تقاس بالتداخل النصي مع الملخصات المرجعية.نتيجة لذلك، تبقى الملخصات التي تم إنشاؤها بالقرب من التركيبات في المستند المصدر.نقترح نموذج * الحكم * نموذج لتوليد المزيد من الملخصات الجماعية.يتضمن وحدة فك ترميز هرمي يقوم أولا بإنشاء تمثيل الجملة الموجزة التالية، ثم ظروف مولد Word على هذا التمثيل.إن ملخصاتنا الناتجة أكثر إشراك وفي الوقت نفسه تحقق درجات روج عالية عند مقارنتها بالملخصات المرجعية البشرية.نتحقق من فعالية قرارات التصميم لدينا بالتقييمات الواسعة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم اعتماد الأساليب القائمة على الرسم البياني مؤخرا لتلخيص نص مبادرة.ومع ذلك، فإن الأساليب القائمة على الرسم البياني الموجودة فقط تنظر فقط في علاقات الكلمات أو معلومات الهيكل، والتي تهمل الارتباط بينهما.في وقت واحد التقاط علاقات الكلمة ومعلومات الهيكل من الجمل، نقترح شبكة الرسم البياني المزدوج الرواية لتلخيص جملة الاختيارات.على وجه التحديد، نقوم أولا بإنشاء رسم بياني للسيناريو الدلالي والكلمة الدلالية الرسم البياني على أساس FRAMENET، وبالتالي تعلم تمثيلاتها وطريقة الانصهار الرسم البياني للتصميم لتعزيز ارتباطها والحصول على تمثيل دلالي أفضل لجيل الملخص.تظهر النتائج التجريبية النموذج لدينا تفوق الأساليب الموجودة في مجموعة بيانات قياسية شعبية، I.E.، GIGAWORD و DUC 2004.
تلقت تلخيص محادثة مبادرة إيلاء اهتمام متزايد في حين تعتمد معظم نماذج تلخيص حديثة حديثة من بين الفنون بشدة على ملخصات المشروح بين الإنسان. للحد من الاعتماد على الملخصات المسمى، في هذا العمل، نقدم مجموعة بسيطة ولكنها فعالة من طرق تكبير بيانات المحادثة (CODA) لعلمة محادثة إفراطية شبه إشراف، مثل تبادل / حذف عشوائي لإضطرب علاقات الخطاب داخل المحادثات، والحوار - الإدراج الموجه المرشد بمقاطعة تطوير المحادثات، والاستبدال القائم على الجيل الشرطي لاستبدال الكلام مع صياغةهم الناتجة بناء على سياق المحادثة. لمزيد من الاستفادة من المحادثات غير المستمرة، نجمع بين Coda مع التدريب الذاتي الصاخب على مرحلتين حيث نقوم أولا بتدريب نموذج التلخيص مسبقا على المحادثات غير المسبقة مع ملخصات زائفة، ثم ضبطها على المحادثات المسمى. توضح التجارب التي أجريت في مجموعات بيانات تلخيص المحادثة الأخيرة فعالية أساليبنا على العديد من خطوط خطوط تكبير البيانات في البيانات.
الملخص نقدم آلية بسيطة ولكن مرنة لتعلم خطة وسيطة للأرض جيل من ملخصات الجماعة. على وجه التحديد، نقوم بإعداد الملخصات المستهدفة (أو المطالبة) مع سلاسل الكيانات --- ترتيب تسلسل الكيانات المذكورة في الملخص. ثم يتم تدريب نماذج التسلسل المستندة إلى التسلسل على المحولات لتوليد سلسلة الكيان ثم تابع إنشاء الملخص مشروط على سلسلة الكيان والإدخال. جربنا كلا من الاحتمالات وتصفيتها مع هدف تخطيط المحتوى هذا. عند تقييمها على CNN / Dailymail، XSUM، SAMSUM، وبيلسين، نوضح تجريبيا أن الجيل الأسطوري له هدف التخطيط يحسن خصوصية الكيان والتخطيط في ملخصات لجميع مجموعات البيانات، وتحقق أداء حديثة على XSUM و SAMSUM من حيث الحمر. علاوة على ذلك، نوضح تجريبيا أن التخطيط مع سلاسل الكيانات يوفر آلية للسيطرة على الهلوسة في ملخصات مبادرة. من خلال مطالبة وحدة فك الترميز بخطة محتوى معدلة تنخفض الكيانات الهلوسة، فإننا نتفوق من الأساليب الحديثة من خلال الإخلاص عند تقييمها تلقائيا والبشر.
هناك فرق حاسم بين تلخيص المستندات الفردية والمتعددة هو كيف يتجلى المحتوى البارز نفسه في المستند (المستندات). على الرغم من أن هذا المحتوى قد يظهر في بداية وثيقة واحدة، إلا أن المعلومات الأساسية تكرر بشكل متكرر في مجموعة من المستندات المتعلقة بموضوع مع ين، مما يؤدي إلى تأثير تأييد يزيد من حية معلومات المعلومات. في هذه الورقة، نقوم بالنماذج تأثير تأييد المستندات عبر المستندات واستخدامها في تلخيص مستندات متعددة. تقوم طريقتنا بإنشاء ملخص من كل مستند، والتي تعمل كموثوقية لتحديد المحتوى البارز من مستندات أخرى. يتم استخدام قطاعات نصية تم تأييدها بشدة لإثراء نموذج فك التشفير العصبي لتعزيزها في ملخص مبيعات. تتمتع هذه الطريقة بإمكانيات كبيرة للتعلم من أمثلة أقل لتحديد المحتوى البارزين، مما يخفف من الحاجة إلى إعادة تدريب مكلفة عند تعديل مجموعة المستندات بشكل حيوي. من خلال تجارب واسعة النطاق حول مجموعات بيانات تلخيص المستندات متعددة الوثائق القياسية، نوضح فعالية أسلوبنا المقترح على خطوط خطوط أساسية منشورة قوية. أخيرا، ألقينا الضوء على اتجاهات البحث في المستقبل ومناقشة تحديات أوسع من هذه المهمة باستخدام دراسة حالة.
على عكس النص المنظم جيدا، مثل التقارير الإخبارية ومقالات الموسوعة، غالبا ما يأتي محتوى الحوار من محاورين أو أكثر، وتبادل المعلومات مع بعضها البعض. في مثل هذا السيناريو، يمكن أن يختلف موضوع المحادثة عند التقدم والمعلومات الأساسية لموضوع معين في كثير م ن الأحيان متناثرة عبر مختلف الكلام من المتكلمين المختلفة، مما يطرح التحديات التي تلخص التخلص من الحوارات بشكل مجردة. لالتقاط معلومات الموضوع المختلفة للمحادثة والحقائق البارزة على الموضوعات التي تم الاستيلاء عليها، يقترح هذا العمل أهدافا للتعلم المتعاواة على علم الموضوع، وهي اكتشاف الاتساق وأهداف الجيل الموجزة الفرعية، والتي من المتوقع أن تقوم بها ضمنيا في تغيير موضوع وتغيير الموضوع تحديات تثير المعلومات لمهمة تلخيص الحوار. يتم تأطير الأهداف المقنعة المقترحة بمثابة مهام مساعدة لمهمة تلخيص الحوار الأساسي، المتحدة عبر استراتيجية تحديث معلمة بديلة. توضح تجارب واسعة النطاق على مجموعات البيانات القياسية أن الطريقة البسيطة المقترحة تتفوق بشكل كبير على خطوط الأساس القوية وتحقق أداء جديد من بين الفني. الرمز والنماذج المدربة متاحة للجمهور عبر.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا