مع الزيادة في عدد الأوراق الأكاديمية المنشورة، تم وضع توقعات متزايدة على البحوث المتعلقة بدعم عملية الكتابة للأوراق العلمية. في الآونة الأخيرة، تم إجراء البحوث على مهام مختلفة مثل جدارة الاقتباس (الحكم على ما إذا كانت الجملة تتطلب الاقتباس) توصية الاقتباس وتوليد نص الاستشهاد. ومع ذلك، نظرا لأن كل مهمة تمت دراستها وتقييمها باستخدام البيانات التي تم تطويرها بشكل مستقل، فمن المستحيل حاليا التحقق مما إذا كانت هذه المهام يمكن أن تقطع أنابيبها بنجاح للاستخدام الفعال في كتابة المستندات العلمية. في هذه الورقة، نحدد أولا سلسلة من المهام المتعلقة بكتابة المستندات العلمية التي يمكن أن تكون خطاء. بعد ذلك، نقوم بإنشاء مجموعة بيانات من الأوراق الأكاديمية التي يمكن استخدامها لتقييم كل مهمة بالإضافة إلى سلسلة من هذه المهام. أخيرا، باستخدام DataSet، نقيم مهام جدارة الاقتباس وتوصية الاقتباس وكذلك كلتا المهام المتكاملة. توضح نتائج تقييماتنا أن النهج المقترح واعد.
With the increase in the number of published academic papers, growing expectations have been placed on research related to supporting the writing process of scientific papers. Recently, research has been conducted on various tasks such as citation worthiness (judging whether a sentence requires citation), citation recommendation, and citation-text generation. However, since each task has been studied and evaluated using data that has been independently developed, it is currently impossible to verify whether such tasks can be successfully pipelined to effective use in scientific-document writing. In this paper, we first define a series of tasks related to scientific-document writing that can be pipelined. Then, we create a dataset of academic papers that can be used for the evaluation of each task as well as a series of these tasks. Finally, using the dataset, we evaluate the tasks of citation worthiness and citation recommendation as well as both of these tasks integrated. The results of our evaluations show that the proposed approach is promising.
المراجع المستخدمة
https://aclanthology.org/
تقدم هذه الورقة نهجا استخراج غير مخطئ لتلخيص المستندات الطويلة العلمية بناء على مبدأ اختناق المعلومات.مستوحاة من العمل السابق الذي يستخدم مبدأ اختناق المعلومات لضغط الجملة، فإننا نقدمها لتلخيص مستوى الوثيقة مع خطوتين منفصلين.في الخطوة الأولى، نستخدم
جدال التعدين أهداف الهياكل باللغة الطبيعية المتعلقة بالترجمة الشفوية والإقناع التي هي أساسية في التواصل العلمي.ينطوي معظم الخطاب العلمي على تفسير الأدلة التجريبية ومحاولة إقناع العلماء الآخرين بتبني نفس الاستنتاجات.في حين أن دراسات التعدين المختلفة ل
تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: ا
إعادة صياغة إعادة صياغة مهمة مهمة في معالجة اللغة الطبيعية. تركز الأشغال السابقة على توليد إعادة صياغة مستوى الجملة، مع تجاهل توليد إعادة صياغة مستوى المستند، وهي مهمة أكثر تحديا وقيمة. في هذه الورقة، نستكشف مهمة إعادة صياغة نص عن طريق الوثيقة لأول م
مع سرعة البحوث المتزايدة بشكل مفيد والحجم المرتفع للاتصال العلمي، يواجه العلماء مهمة شاقة. ليس فقط يجب عليهم مواكبة الأدبيات المتزايدة في مجالاتهم ذات الصلة، كما يحتاج العلماء بشكل متزايد إلى إعادة صياغة العلوم الزائفة والإضاءة. تحفز هذه الاحتياجات ت