تقدم هذه الورقة النتائج الأولية للمشروع الجاري الذي يحلل الجسم المتنامي للبحث العلمي الذي نشر حول جائحة CovID-19.في هذا البحث، يتم استخدام نموذج دلالي للأغراض العامة لتعليق دفعة من 500 جمل تم اختيارها يدويا من Cord-19 Corpus.بعد ذلك، تم تصميم وتقييم خط أنابيب تعدين النص الأساسي من خلال مجموعة كبيرة من جمل 100،959.نقدم تحليلا نوعيا للحقائق الأكثر إثارة للاهتمام استخراجها تلقائيا وتسليط الضوء على خطوط التنمية المستقبلية المحتملة.تظهر النتائج الأولية أن النماذج الدلالية للأغراض العامة هي أداة مفيدة لاكتشاف معرفة غرامة المحبوس في كورسا الوثائق العلمية الكبيرة.
This paper presents the preliminary results of an ongoing project that analyzes the growing body of scientific research published around the COVID-19 pandemic. In this research, a general-purpose semantic model is used to double annotate a batch of 500 sentences that were manually selected from the CORD-19 corpus. Afterwards, a baseline text-mining pipeline is designed and evaluated via a large batch of 100,959 sentences. We present a qualitative analysis of the most interesting facts automatically extracted and highlight possible future lines of development. The preliminary results show that general-purpose semantic models are a useful tool for discovering fine-grained knowledge in large corpora of scientific documents.
المراجع المستخدمة
https://aclanthology.org/
لمكافحة Covid-19، يحتاج كلا من الأطباء والعلماء إلى هضم كمية شاسعة من المعرفة الطبية الحيوية ذات الصلة في الأدب لفهم آلية المرض والوظائف البيولوجية ذات الصلة.لقد قمنا بتطوير إطار اكتشاف رواية وشامل للمعرفة، Covid-KG لاستخراج عناصر المعرفة بالوسائط ال
نقترح التصور الدلالي كطريقة تحليلية بصرية لغوية.يمكنها تمكين الاستكشاف والاكتشاف على مجموعات البيانات الكبيرة للشبكات المعقدة من خلال استغلال دلالات العلاقات فيها.ينطوي ذلك على استخراج المعلومات، وتطبيق عمليات الحد من المعلمات، وبناء تمثيل البيانات ا
ولدت جائحة Covid-19 هيئة متنوعة من الأدبيات العلمية تحديا في التنقل، وتحفيز الاهتمام بالأدوات الآلية للمساعدة في العثور على معرفة مفيدة.نحن نتابع بناء قاعدة المعرفة (KB) من الآليات --- مفهوم أساسي في جميع أنحاء العلوم، والذي يشمل الأنشطة والوظائف وال
في هذه الورقة، نقدم مجموعة بيانات Arcov-19، وهي مجموعة بيانات عربية Covid-19 Twitter التي تمتد لمدة عام واحد، تغطي الفترة من 27 يناير 2020 حتى 31 يناير 2021. Arcov-19 هي أول مجموعة بيانات عربية تويتر العربية التي تغطي كوفي -19 الوباء يتضمن حوالي 2.7
توفر هذه الورقة نظرة عامة مفصلة للنظام ونتائجها، والتي تم إنتاجها كجزء من المهمة المشتركة NLP4IF بشأن مكافحة المعكرات المعاكسة 19 في Naacl 2021. هذه المهمة تم إنجازها باستخدام مجموعة متنوعة من التقنيات.استخدمنا نماذج التمثيل النصية الحديثة للسياق الت