تصف هذه الورقة نظامنا (IREL) لتصنيف سياق استشهاد 3C - مهمة مشتركة من ورشة عمل معالجة الوثيقات العلمية في Naacl 2021. شاركنا في كل من التركاس الفرعي A و Subtask B. لقد حقق أفضل نظامنا على درجة ماكرو F1 من 0.26973 على المتصدرين الخاصينللحصول على التراكج الفرعية واحتل المرتبة الأولى.بالنسبة إلى SubTask B أفضل نظامنا الذي حقق درجات ماكرو F1 من 0.59071 على المتصدرين الخاص وكان المرتبة الثانية.استخدمنا نماذج مماثلة لكل من المهن الفرعية مع بعض التغييرات الطفيفة، كما تمت مناقشته في هذه الورقة.كان لدينا أفضل نموذج أداء لكلا المراكب الفرعي هو نموذج Scibert Finetuned متبوعا بطبقة خطية.توفر هذه الورقة وصفا مفصلا لجميع الأساليب التي حاولناها ونتائجها.
This paper describes our system (IREL) for 3C-Citation Context Classification shared task of the Scholarly Document Processing Workshop at NAACL 2021. We participated in both subtask A and subtask B. Our best system achieved a Macro F1 score of 0.26973 on the private leaderboard for subtask A and was ranked one. For subtask B our best system achieved a Macro F1 score of 0.59071 on the private leaderboard and was ranked two. We used similar models for both the subtasks with some minor changes, as discussed in this paper. Our best performing model for both the subtask was a finetuned SciBert model followed by a linear layer. This paper provides a detailed description of all the approaches we tried and their results.
المراجع المستخدمة
https://aclanthology.org/
نقدم دخولنا إلى تصنيف سياق استشهاد المهام المشترك 2021 3C بناء على منافسة الغرض.الهدف من المسابقة هو تصنيف الاقتباس في مادة علمية بناء على هدفها.هذه المهمة مهمة لأنه من المحتمل أن تؤدي إلى طرق أكثر شمولا لتلخيص الغرض واستخدامات المقالات العلمية، ولكن
الاستشهادات حاسمة خطاب علمي. إلى جانب توفير سياقات إضافية للأوراق البحثية، تعمل الاستشهادات كمسارات لتوجيه الأبحاث في مجال وكي تدبير مهم في فهم تأثير منشور بحثي. مع النمو السريع في المنشورات البحثية، أصبحت الحلول الآلية لتحديد الغرض وتأثير الاستشهادا
نقترح شبكة الخصومة المولدة المخلوذة التي تعتمد على الانتباه (باسم Magan)، وتطبيقها على تصنيف نية الاقتباس في المنشور العلمي.نقوم باختيار بيانات التدريب الخاصة بالمجال، واقترح آلية اهتمامية مختلطة، وتوظيف بنية شبكة الخصومة التوليدية لنموذج لغة التدريب
توفر هذه الورقة لمحة عامة عن مهمة تصنيف سياق Citted Citted 2021 3c.تم تنظيم الطبعة الثانية من المهمة المشتركة كجزء من ورشة العمل الثانية بشأن معالجة الوثائق العلمية (SDP 2021).تتكون المهمة من اثنين من المهام الفرعية: تصنيف الاستشهادات بناء على الغرض
غالبا ما تشمل توصيات المرادف التقليدية اقتراحات غير مناسبة للسياقات المحددة للكاتب.نقترح نهج بسيط لتوصية مرادف السياق من خلال الجمع بين الرسوم البيانية القائمة على الإنسان، على سبيل المثالWordnet، مع نماذج اللغة المدربة مسبقا.نقوم بتقييم تقنيةنا عن ط