نقترح نهجا جديدا لتوليد متغيرات متعددة من الملخص المستهدف بمحتوى متنوع وأطوال متفاوتة، ثم يسجل واختيار تلك المقبولة وفقا لاحتياجات المستخدمين. قد تكافح الملخصات المحظورة المدربين على ملخصات مرجعية واحدة لإنتاج مخرجات تحقق خصائص مرغوبة متعددة، أي القبض على أهم المعلومات، كونها مخلصة للأصلية النحوية والطلاقة. في هذه الورقة، نقترح استراتيجية من نظامها التابعتين لتوليد مجموعة متنوعة من الملخصات المرشحة من النص المصدر في المرحلة الأولى، ثم يسجل واختيار تلك المقابلة في المرحلة الثانية. الأهم من ذلك، يعطي مولدنا سيطرة دقيقة على طول الملخص، وهو مناسب بشكل خاص عندما تكون المساحة محدودة. تم تصميم المحددين لدينا للتنبؤ بطول الملخص الأمثل ووضع التركيز بشكل خاص على الإخلاص للنص الأصلي. يمكن تدريب كلا المرحلتين بشكل فعال، وتحسينها وتقييمها. تشير تجاربنا على مجموعات بيانات التلخيص المعجمية إلى أن هذه النموذج يمكن أن تحقق أداء أحدث.
We propose a new approach to generate multiple variants of the target summary with diverse content and varying lengths, then score and select admissible ones according to users' needs. Abstractive summarizers trained on single reference summaries may struggle to produce outputs that achieve multiple desirable properties, i.e., capturing the most important information, being faithful to the original, grammatical and fluent. In this paper, we propose a two-staged strategy to generate a diverse set of candidate summaries from the source text in stage one, then score and select admissible ones in stage two. Importantly, our generator gives a precise control over the length of the summary, which is especially well-suited when space is limited. Our selectors are designed to predict the optimal summary length and put special emphasis on faithfulness to the original text. Both stages can be effectively trained, optimized and evaluated. Our experiments on benchmark summarization datasets suggest that this paradigm can achieve state-of-the-art performance.
المراجع المستخدمة
https://aclanthology.org/
نقدم طريقة عامة لحساب الدقة الملحة لتخفيف البيانات الناتجة عن الحد الأدنى من جهود المستخدم.نحن ننظر إلى Prob-Lem كهامة لفحص الحقائق للتحقق من مطالبات NU-Merical في النص.يفترض التحقق من Gorithm أن البيانات المستخدمة في الحصول على النص متاح.في هذه الور
تلخص هذه الورقة محاولة ارتكبناها لتلبية تحدي مهمة مشتركة بشأن ملخصات التأريض التي تم إنشاؤها بواسطة الجهاز في مباريات NBA (https://github.com/ehudreiter//accuracysharedtsask.git).في النصف الأول، نناقش الأساليب وفي الثانية، نبلغ عن النتائج، جنبا إلى ج
إن التذرع بمنع انتهاكات حقوق الإنسان أو وقفها وإنقاذ السكان المدنيين من خطر محدق، لتتدخل دولة أو مجموعة من الدول في الشؤون الداخلية لدولة أخرى دون رضاها، ليس جديداً؛ إذ ترجع الجذور الأولى لهذه الفكرة إلى عدة قرون خلت، وقد شهدنا في جميع الأزمنة محاولا
نقترح استخدام مهمة مكتملة متعددة الطبق لتقييم تمثيلات مورفوسنيتشية ل Adgeddings Word متعددة اللغات. هذا القرص في التحقيق الكنسي يجعل من السهل استكشاف تمثيلات مورفوسنيتشية، كلاهما بشكل كلي وعلى مستوى الميزات الفردية (على سبيل المثال، النوع الاجتماعي و
في الطبعة السادسة من المهمة الطبية الحيوية WMT، تناولنا إجمالي ثماني أزواج لغوية، وهي الإنجليزية / الألمانية، الإنجليزية / الفرنسية، الإنجليزية / الإسبانية، الإنجليزية / البرتغالية، الإنجليزية / الصينية، الإنجليزية / الروسية، الإنجليزية / الإيطالية،