ترغب بنشر مسار تعليمي؟ اضغط هنا

التمثيل عقوبة سيبارت لتصنيف سياق الاقتباس

SciBERT Sentence Representation for Citation Context Classification

276   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة نظامنا (IREL) لتصنيف سياق استشهاد 3C - مهمة مشتركة من ورشة عمل معالجة الوثيقات العلمية في Naacl 2021. شاركنا في كل من التركاس الفرعي A و Subtask B. لقد حقق أفضل نظامنا على درجة ماكرو F1 من 0.26973 على المتصدرين الخاصينللحصول على التراكج الفرعية واحتل المرتبة الأولى.بالنسبة إلى SubTask B أفضل نظامنا الذي حقق درجات ماكرو F1 من 0.59071 على المتصدرين الخاص وكان المرتبة الثانية.استخدمنا نماذج مماثلة لكل من المهن الفرعية مع بعض التغييرات الطفيفة، كما تمت مناقشته في هذه الورقة.كان لدينا أفضل نموذج أداء لكلا المراكب الفرعي هو نموذج Scibert Finetuned متبوعا بطبقة خطية.توفر هذه الورقة وصفا مفصلا لجميع الأساليب التي حاولناها ونتائجها.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم دخولنا إلى تصنيف سياق استشهاد المهام المشترك 2021 3C بناء على منافسة الغرض.الهدف من المسابقة هو تصنيف الاقتباس في مادة علمية بناء على هدفها.هذه المهمة مهمة لأنه من المحتمل أن تؤدي إلى طرق أكثر شمولا لتلخيص الغرض واستخدامات المقالات العلمية، ولكن من الصعب أيضا، ويرجع ذلك أساسا إلى كمية محدودة من البيانات التدريبية المتاحة التي كانت فيها أغراض كل الاقتباس يدوياالمسمى، جنبا إلى جنب مع الذاتية لهذه الملصقات.إن دخولنا في المسابقة هو نموذج متعدد المهام يجمع بين وحدات متعددة مصممة للتعامل مع المشكلة من وجهات نظر مختلفة، بما في ذلك الميزات اللغوية التي تم إنشاؤها يدويا، وميزات TF-IDF، ونموذج LSTM- مع الانتباه.كما نقدم دراسة الاجتثاث والتحليل الميزات التي يمكن أن تؤدي رؤيتها إلى العمل في المستقبل.
الاستشهادات حاسمة خطاب علمي. إلى جانب توفير سياقات إضافية للأوراق البحثية، تعمل الاستشهادات كمسارات لتوجيه الأبحاث في مجال وكي تدبير مهم في فهم تأثير منشور بحثي. مع النمو السريع في المنشورات البحثية، أصبحت الحلول الآلية لتحديد الغرض وتأثير الاستشهادا ت مهمة للغاية. تعد مهمة تصنيف سياق الاقتباس 3C المنظم كجزء من ورشة العمل الثانية حول معالجة المستندات العلمية @ Naacl 2021 مهمة مشتركة لمعالجة المشكلات المذكورة أعلاه. في هذه الورقة، نقدم فريقنا، تقديم IITP-CUNI @ 3C إلى المهام المشتركة 3C. بالنسبة للمهمة، تصنيف غرض سياق الاقتباس، نقترح إطارا تعليميا متعدد المهام العصبي الذي يسخر بالمعلومات الهيكلية للأوراق البحثية والعلاقة بين سياق الاقتباس والورقة المذكورة لتصنيف الاقتباس. بالنسبة للمهمة ب، تؤثر سياق الاقتباس على التصنيف، نستخدم مجموعة من الميزات البسيطة لتصنيف الاستشهادات بناء على أهميتها المتصورة. نحن نحقق أداء مماثل فيما يتعلق بأفضل أنظمة أداء في المهمة واحذف خط الأساس الأغلبية في المهمة B مع ميزات بسيطة للغاية.
نقترح شبكة الخصومة المولدة المخلوذة التي تعتمد على الانتباه (باسم Magan)، وتطبيقها على تصنيف نية الاقتباس في المنشور العلمي.نقوم باختيار بيانات التدريب الخاصة بالمجال، واقترح آلية اهتمامية مختلطة، وتوظيف بنية شبكة الخصومة التوليدية لنموذج لغة التدريب المسبق والضبط الجميل لمهمة التصنيف متعددة الطبقات المصب.أجريت التجارب على مجموعات البيانات SCICITE لمقارنة الأداء النموذجي.حقق نموذج Magan المقترح أفضل ماكرو - F1 من 0.8532.
توفر هذه الورقة لمحة عامة عن مهمة تصنيف سياق Citted Citted 2021 3c.تم تنظيم الطبعة الثانية من المهمة المشتركة كجزء من ورشة العمل الثانية بشأن معالجة الوثائق العلمية (SDP 2021).تتكون المهمة من اثنين من المهام الفرعية: تصنيف الاستشهادات بناء على الغرض (فرعي أ) تأثير (فرعي ب) تأثير.كما هو الحال في العام السابق، استضافت كلا المهام على Kaggle واستخدم جزءا من بيانات ACT الجديدة.شارك ما مجموعه 22 فريقا في المراكب الفرعية أ، و 19 فريقا تنافس في المراكب الفرعية ب. تم احتلال جميع الأنظمة المشاركة في المرتبة على أساس ماكرو F-Score.تم الإبلاغ عن أعلى درجات من 0.26973 و 0.60025 عن التركيب الفرعي A و B على التوالي.
غالبا ما تشمل توصيات المرادف التقليدية اقتراحات غير مناسبة للسياقات المحددة للكاتب.نقترح نهج بسيط لتوصية مرادف السياق من خلال الجمع بين الرسوم البيانية القائمة على الإنسان، على سبيل المثالWordnet، مع نماذج اللغة المدربة مسبقا.نقوم بتقييم تقنيةنا عن ط ريق برعاية مجموعة من أزواج الجملة بكلمة الكلمة متوازنة عبر كوربورا وأجزاء الكلام، ثم قم بتسليم كل زوج جملة الكلمة مع مجموعة من المرادفات المناسبة للسياق.وجدنا أن نهج نموذج اللغة الأساسية لها دقة أعلى.الأساليب الاستفادة من سياق الجملة لها استدعاء أعلى.بشكل عام، كانت النهج السياقي الأخير لديه أعلى درجة F.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا