مع سرعة البحوث المتزايدة بشكل مفيد والحجم المرتفع للاتصال العلمي، يواجه العلماء مهمة شاقة. ليس فقط يجب عليهم مواكبة الأدبيات المتزايدة في مجالاتهم ذات الصلة، كما يحتاج العلماء بشكل متزايد إلى إعادة صياغة العلوم الزائفة والإضاءة. تحفز هذه الاحتياجات ت
ركيزا متزايدا على الأساليب الحسابية لتعزيز البحث والتلخيص وتحليل الوثائق العلمية. ومع ذلك، فإن خيوط البحث المختلفة بشأن معالجة الوثائق العلمية تظل مجزأة. للوصول إلى مجتمع NLP و AI / ML الأوسع، بجميع الجهود الموزعة في هذا المجال، وتمكين الوصول المشترك إلى البحث المنشور، عقدنا ورشة العمل الثانية بشأن معالجة الوثائق العلمية (SDP) في Naacl 2021 كحدث افتراضي (HTTPS: //sdproc.org/2021/). تتألف ورشة عمل SDP من مسار أبحاث وثلاثة محادثات مدعوة وثلاث مهام مشتركة (LongsUMM 2021، SEXIVER، و 3C). تم توجيه البرنامج نحو تطبيق NLP واسترجاع المعلومات والتعدين البيانات للمستندات العلمية، مع التركيز على تحديد وحلول الحلول لفتح التحديات.
جدال التعدين أهداف الهياكل باللغة الطبيعية المتعلقة بالترجمة الشفوية والإقناع التي هي أساسية في التواصل العلمي.ينطوي معظم الخطاب العلمي على تفسير الأدلة التجريبية ومحاولة إقناع العلماء الآخرين بتبني نفس الاستنتاجات.في حين أن دراسات التعدين المختلفة ل
لحجة قد تناولت مقالات الطلاب والمقالات الإخبارية، فإن تلك التي تستهدف الخطاب العلمي لا تزال نادرة.تقوم هذه الورقة بالمسوحات الحالية بالعمل الموجود في حجة تعدين الخطاب العلمي، ويوفر نظرة عامة على النماذج الحالية والبيانات والمهام والتطبيقات الحالية.نحدد عددا من التحديات الرئيسية التي تواجه الحجة التعدين في المجال العلمي، وتشير إلى بعض الحلول الممكنة والاتجاهات المستقبلية.