تم تلخيص الاستخراج هو الدعامة الرئيسية للتلخيص التلقائي لعدة عقود. على الرغم من كل التقدم المحرز، ما زالت الملخصات الاستخراجية تعاني من أوجه القصور بما في ذلك مشاكل Aquerence الناشئة عن استخراج الجمل بعيدا عن سياقها الأصلي في المستند المصدر. هذا يؤثر على تماسك وكمية ملخصات الاستخراجية. في هذا العمل، نقترح خطوة خفيفة الوزن لتحرير الوزن للملخصات الاستخراجية التي تقوم بمراكز حول قرار لغز واحد: استئناف عبارات الاسم. نقوم بإجراء دراسات التقييم البشرية التي تظهر أن قضاة الخبراء البشري يفضلون بشكل كبير إنتاج نظامنا المقترح على الملخصات الأصلية. علاوة على ذلك، بناء على دراسة تقييم تلقائي، نقدم دليلا على قدرة نظامنا على توليد القرارات اللغوية التي تؤدي إلى تحسين ملخصات الاستخراجية. نرسم أيضا رؤى حول كيفية استغلال النظام الأوتوماتيكي بعض الإشارات المحلية المتعلقة بأسلوب كتابة نصوص المقال الرئيسية أو النصوص الموجزة لجعل القرارات، بدلا من التفكير حول السياقات بشكل عملي.
Extractive summarization has been the mainstay of automatic summarization for decades. Despite all the progress, extractive summarizers still suffer from shortcomings including coreference issues arising from extracting sentences away from their original context in the source document. This affects the coherence and readability of extractive summaries. In this work, we propose a lightweight post-editing step for extractive summaries that centers around a single linguistic decision: the definiteness of noun phrases. We conduct human evaluation studies that show that human expert judges substantially prefer the output of our proposed system over the original summaries. Moreover, based on an automatic evaluation study, we provide evidence for our system's ability to generate linguistic decisions that lead to improved extractive summaries. We also draw insights about how the automatic system is exploiting some local cues related to the writing style of the main article texts or summary texts to make the decisions, rather than reasoning about the contexts pragmatically.
المراجع المستخدمة
https://aclanthology.org/
تكنولوجيات اللغة، مثل الترجمة الآلية (MT)، ولكن أيضا تطبيق الذكاء الاصطناعي بشكل عام ووفرة من أدوات القطط والمنصات لها تأثير متزايد على سوق الترجمة. تصبح التفاعل البشري مع هذه التقنيات أكثر أهمية على الإطلاق لأنها تؤثر على سير عمل المترجمين وبيئات ال
الملخصات التلقائية لديها القدرة على مساعدة الأطباء في تبسيط المهام الكتابية مثل اتخاذ الملاحظات.ولكن من الصعب بشكل مسهل تقييم هذه الأنظمة وإظهار أنها آمنة لاستخدامها في بيئة سريرية.للتحايل على هذه المسألة، نقترح نهج شبه تلقائي حيث يلاحظ الأطباء بعد ت
يتم استخدام نماذج ما بعد التحرير التلقائي (APE) مخرجات نظام الترجمة الآلية (MT) الصحيحة عن طريق التعلم من أنماط ما بعد التحرير البشري.نقدم النظام المستخدم في التقديم الخاص بنا إلى المهمة المشتركة (APE) APانية (EN-DE).نستفيد نظام MT الحديث (NG et al.،
تبنت تكنولوجيا اللغة بالفعل إلى حد كبير من قبل معظم مزودي خدمات اللغة (LSPs) ومدمج في عمليات الترجمة التقليدية. في هذا السياق، هناك العديد من الأساليب المختلفة لتطبيق النصوص بعد التحرير (PE) من نص مترجمة النص، بما في ذلك عمليات سير عمل مختلفة وخطوات
قام تطوير تقنيات الترجمة، مثل ذاكرة الترجمة والترجمة الآلية، قد غيرت تماما سير عمل صناعة الترجمة وسير العمل في العقود الماضية.ومع ذلك، تم تطوير TM و MT بشكل منفصل حتى وقت قريب.سيقوم هذا المشروع المستمر بدراسة التكامل الخارجي ل TM و MT، وفحص ما إذا كا