ترغب بنشر مسار تعليمي؟ اضغط هنا

IITP-CUNI @ 3C: النهج الإشرافية لتصنيف الاقتباس (المهمة أ) والكشف عن أهمية الاقتباس (المهمة ب)

IITP-CUNI@3C: Supervised Approaches for Citation Classification (Task A) and Citation Significance Detection (Task B)

154   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الاستشهادات حاسمة خطاب علمي. إلى جانب توفير سياقات إضافية للأوراق البحثية، تعمل الاستشهادات كمسارات لتوجيه الأبحاث في مجال وكي تدبير مهم في فهم تأثير منشور بحثي. مع النمو السريع في المنشورات البحثية، أصبحت الحلول الآلية لتحديد الغرض وتأثير الاستشهادات مهمة للغاية. تعد مهمة تصنيف سياق الاقتباس 3C المنظم كجزء من ورشة العمل الثانية حول معالجة المستندات العلمية @ Naacl 2021 مهمة مشتركة لمعالجة المشكلات المذكورة أعلاه. في هذه الورقة، نقدم فريقنا، تقديم IITP-CUNI @ 3C إلى المهام المشتركة 3C. بالنسبة للمهمة، تصنيف غرض سياق الاقتباس، نقترح إطارا تعليميا متعدد المهام العصبي الذي يسخر بالمعلومات الهيكلية للأوراق البحثية والعلاقة بين سياق الاقتباس والورقة المذكورة لتصنيف الاقتباس. بالنسبة للمهمة ب، تؤثر سياق الاقتباس على التصنيف، نستخدم مجموعة من الميزات البسيطة لتصنيف الاستشهادات بناء على أهميتها المتصورة. نحن نحقق أداء مماثل فيما يتعلق بأفضل أنظمة أداء في المهمة واحذف خط الأساس الأغلبية في المهمة B مع ميزات بسيطة للغاية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة نظامنا (IREL) لتصنيف سياق استشهاد 3C - مهمة مشتركة من ورشة عمل معالجة الوثيقات العلمية في Naacl 2021. شاركنا في كل من التركاس الفرعي A و Subtask B. لقد حقق أفضل نظامنا على درجة ماكرو F1 من 0.26973 على المتصدرين الخاصينللحصول على التراك ج الفرعية واحتل المرتبة الأولى.بالنسبة إلى SubTask B أفضل نظامنا الذي حقق درجات ماكرو F1 من 0.59071 على المتصدرين الخاص وكان المرتبة الثانية.استخدمنا نماذج مماثلة لكل من المهن الفرعية مع بعض التغييرات الطفيفة، كما تمت مناقشته في هذه الورقة.كان لدينا أفضل نموذج أداء لكلا المراكب الفرعي هو نموذج Scibert Finetuned متبوعا بطبقة خطية.توفر هذه الورقة وصفا مفصلا لجميع الأساليب التي حاولناها ونتائجها.
نقدم دخولنا إلى تصنيف سياق استشهاد المهام المشترك 2021 3C بناء على منافسة الغرض.الهدف من المسابقة هو تصنيف الاقتباس في مادة علمية بناء على هدفها.هذه المهمة مهمة لأنه من المحتمل أن تؤدي إلى طرق أكثر شمولا لتلخيص الغرض واستخدامات المقالات العلمية، ولكن من الصعب أيضا، ويرجع ذلك أساسا إلى كمية محدودة من البيانات التدريبية المتاحة التي كانت فيها أغراض كل الاقتباس يدوياالمسمى، جنبا إلى جنب مع الذاتية لهذه الملصقات.إن دخولنا في المسابقة هو نموذج متعدد المهام يجمع بين وحدات متعددة مصممة للتعامل مع المشكلة من وجهات نظر مختلفة، بما في ذلك الميزات اللغوية التي تم إنشاؤها يدويا، وميزات TF-IDF، ونموذج LSTM- مع الانتباه.كما نقدم دراسة الاجتثاث والتحليل الميزات التي يمكن أن تؤدي رؤيتها إلى العمل في المستقبل.
توفر هذه الورقة لمحة عامة عن مهمة تصنيف سياق Citted Citted 2021 3c.تم تنظيم الطبعة الثانية من المهمة المشتركة كجزء من ورشة العمل الثانية بشأن معالجة الوثائق العلمية (SDP 2021).تتكون المهمة من اثنين من المهام الفرعية: تصنيف الاستشهادات بناء على الغرض (فرعي أ) تأثير (فرعي ب) تأثير.كما هو الحال في العام السابق، استضافت كلا المهام على Kaggle واستخدم جزءا من بيانات ACT الجديدة.شارك ما مجموعه 22 فريقا في المراكب الفرعية أ، و 19 فريقا تنافس في المراكب الفرعية ب. تم احتلال جميع الأنظمة المشاركة في المرتبة على أساس ماكرو F-Score.تم الإبلاغ عن أعلى درجات من 0.26973 و 0.60025 عن التركيب الفرعي A و B على التوالي.
نقترح شبكة الخصومة المولدة المخلوذة التي تعتمد على الانتباه (باسم Magan)، وتطبيقها على تصنيف نية الاقتباس في المنشور العلمي.نقوم باختيار بيانات التدريب الخاصة بالمجال، واقترح آلية اهتمامية مختلطة، وتوظيف بنية شبكة الخصومة التوليدية لنموذج لغة التدريب المسبق والضبط الجميل لمهمة التصنيف متعددة الطبقات المصب.أجريت التجارب على مجموعات البيانات SCICITE لمقارنة الأداء النموذجي.حقق نموذج Magan المقترح أفضل ماكرو - F1 من 0.8532.
تصف هذه الورقة مهمة Charles University الفرعية للمصطلحات المهمة المشتركة للترجمة في WMT21.الهدف من هذه المهمة هو تصميم نظام يترجم مع شروط معينة بناء على قاعدة بيانات المصطلحات المقدمة، مع الحفاظ على جودة الترجمة الشاملة عالية.تنافسنا في زوج اللغة الإ نجليزية الفرنسية.يعتمد نهجنا على توفير الترجمات المرغوبة إلى جانب جملة الإدخال وتدريب النموذج لاستخدام هذه المصطلحات المقدمة.نحن Lemmatize المصطلحات على حد سواء أثناء التدريب والاستدلال، للسماح للنموذج لمعرفة كيفية إنتاج الأشكال السطحية الصحيحة للكلمات، عندما تختلف عن النماذج المتوفرة في قاعدة بيانات المصطلحات.تم تصنيف تقديمنا في المرتبة الثانية في مقياس التطابق الدقيق الذي يقوم بتقييم قدرة النموذج على إنتاج المصطلحات المرغوبة في الترجمة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا