توفر شرائح العرض التقديمية الناتجة عن أوراق البحث الأصلية نموذجا فعالا لتقديم ابتكارات بحثية.توليد شرائح العرض يدويا هي كثيفة العمالة.نقترح طريقة لإنشاء الشرائح تلقائيا للمقالات العلمية المستندة إلى كائن من 5000 من أزواج الشريحة الورقية التي تم تجميعها من مواقع ويب إجراءات المؤتمرات.تستند وحدة وضع العلامات الخاصة بالحكم من طريقتنا إلى SummarUnner، نموذج التسلسل العصبي لتلخيص الاستخراج.بدلا من الترتيب الجمل بناء على أوجه التشابه الدلالي في المستند بأكمله، تقيس خوارزميةنا أهمية وحد الجمل عن طريق الجمع بين الميزات الدلالية والجنيات في إطار الجملة.تتفوق طريقةنا على العديد من الطرق الأساسية بما في ذلك SummarUnner بهامش مهم من حيث درجة Rouge.
Presentation slides generated from original research papers provide an efficient form to present research innovations. Manually generating presentation slides is labor-intensive. We propose a method to automatically generates slides for scientific articles based on a corpus of 5000 paper-slide pairs compiled from conference proceedings websites. The sentence labeling module of our method is based on SummaRuNNer, a neural sequence model for extractive summarization. Instead of ranking sentences based on semantic similarities in the whole document, our algorithm measures the importance and novelty of sentences by combining semantic and lexical features within a sentence window. Our method outperforms several baseline methods including SummaRuNNer by a significant margin in terms of ROUGE score.
المراجع المستخدمة
https://aclanthology.org/
في هذا العمل، قارننا تجريبيا أساليب استخراج الفصول لمهمة الدور الدلالي (SRL).في حين أن التقدم الأخير الذي يشتمل على تمثيلات محكومة مدربة مسبقا في الترميز العصبية قد حسن بشكل كبير أداء SRL F1 بشأن المعايير الشعبية، فإن التكاليف المهمة وفوائد فك التشفي
في حين أن Framenet تعتبر على نطاق واسع كمورد غني من الدلالات في معالجة اللغات الطبيعية، فإن النقد الرئيسي يتعلق بعدم وجود تغطية وندرة نسبية لبياناتها المسمدة مقارنة بالموارد المعمارية الأخرى المستخدمة مثل Propbank و Verbnet. تقارير الورقة هذه عن دراس
تتفوق أنظمة تلخيص التلخيص الحالية على نظرائهم المستخرجين، لكن اعتمادهم على نطاق واسع يمنعهم الافتقار المتأصل إلى الترجمة الشفوية. أنظمة تلخيص الاستخراجية، على الرغم من أنه قابل للتفسير، تعاني من التكرار وقلة الاتساق المحتمل. لتحقيق أفضل ما في العالمي
على الرغم من أن التطورات الأخيرة في الهندسة العصبية والتمثيلات المدربة مسبقا قد زادت بشكل كبير من الأداء النموذجي للحدث على وضع العلامات الدلالية الخاضعة للإشراف بالكامل (SRL)، فإن المهمة تظل تحديا لغات حيث تكون بيانات تدريب SRL الإشرافية غير وفيرة.ي
تم تلخيص الاستخراج هو الدعامة الرئيسية للتلخيص التلقائي لعدة عقود. على الرغم من كل التقدم المحرز، ما زالت الملخصات الاستخراجية تعاني من أوجه القصور بما في ذلك مشاكل Aquerence الناشئة عن استخراج الجمل بعيدا عن سياقها الأصلي في المستند المصدر. هذا يؤثر