ترغب بنشر مسار تعليمي؟ اضغط هنا

نظرة عامة وأفكار من المهمة المشتركة السكري بشأن التحقق العلمي

Overview and Insights from the SCIVER shared task on Scientific Claim Verification

418   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم نظرة عامة على المهمة المشتركة السكري، التي قدمت في ورشة عمل المعالجة بالوثائق العلمية الثانية (SDP) في Naacl 2021. وفي هذه المهمة المشتركة، قدمت النظم مطالبة علمية وجزح من ملخصات البحث، وطلب تحديد المقالات التي تدعمهاأو دحض المطالبة وكذلك توفير جمل إثبات تبرير هذه الملصقات.11 قدمت فرق ما مجموعه 14 تقريرا إلى المتصدرين المهمة المشتركة، مما يؤدي إلى تحسين أكثر من +23 F1 على متري تقييم المهام الأساسية.بالإضافة إلى مسح النظم المشاركة، فإننا نقدم العديد من الأفكار في نهج النمذجة لدعم التقدم المحرز المستمر والبحث في المستقبل حول المهمة المهمة والصعبة للتحقق من الادعاء العلمي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

شهد حقل NLP مؤخرا زيادة كبيرة في العمل المتعلق بتكاثر النتائج، وأكثر اعترافا بشكل عام بأهمية وجود تعريفات وممارسات مشتركة تتعلق بالتقييم. وقد تركز الكثير من العمل على الاستيلاء على الدرجات المترية حتى الآن، مع استنساخ نتائج التقييم البشرية التي تتلقى اهتماما أقل بكثير. كجزء من برنامج بحثي مصمم لتطوير نظرية وممارسة تقييم استنساخ في NLP، نظمت المهمة المشتركة الأولى بشأن استنساخ التقييمات البشرية، وتوبيخ 2021. تصف هذه الورقة المهمة المشتركة بالتفصيل، تلخص النتائج من كل مجال من دراسات الاستنساخ قدمت، ويوفر المزيد من التحليل المقارن للنتائج. من بين تسع تسجيلات الفريق الأولية، تلقينا عروض من أربعة فرق. كشف التحليل التلوي لدراسات الاستنساخ الأربعة عن درجات متفاوتة من التكاثر، وسمحت باستنتاجات أولية مبدئية للغاية حول أنواع التقييم التي تميل إلى تحسين استنساخ أفضل.
توفر هذه الورقة نظرة عامة على المهمة المشتركة WANLP 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية.المهمة المشتركة لها مفتاحان فرعي: الكشف عن السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).تهدف هذه المهمة المشتركة إلى الترويج والاهتمام بالكشف عن السخرية العربية، وهو أمر بالغ الأهمية لتحسين الأداء في مهام أخرى مثل تحليل المعرفات.تتكون DataSet المستخدمة في هذه المهمة المشتركة، وهي Arsarcasm-V2، من 15،548 تغريدات تسمى السخرية والشعور واللهجة.تلقينا 27 و 22 عروضا للمجموعات الفرعية 1 و 2 على التوالي.تعتمد معظم النهج على استخدام النماذج اللغوية المدربة مسبقا وضبطها جيدا مثل أرابيرت وماربرت.وكانت أفضل النتائج التي تحققت في مهام تحليل السخرية وتحليل المعنويات 0.6225 F1 و 0.748 F1-PN على التوالي.
في هذه الورقة، نقدم المهمة المشتركة ESPR4NLP-2021 على تقدير الجودة القادم.بالنظر إلى زوج ترجمة من المصدر، فإن هذه المهمة المشتركة لا تتطلب فقط توفير درجة على مستوى الجملة تشير إلى الجودة الشاملة للترجمة، ولكن أيضا لشرح هذه النقاط عن طريق تحديد الكلما ت التي تؤثر سلبا على جودة الترجمة.نقدم البيانات وإرشادات التوضيحية وإعداد تقييم المهمة المشتركة، وصف النظم الستة المشاركة وتحليل النتائج.إلى حد ما من معرفتنا، هذه هي المهمة المشتركة الأولى على مقاييس تقييم NLP القابلة للتفسير.تتوفر مجموعات البيانات والنتائج في https://github.com/eval4nlp/sharedtask2021.
يصف هذا العمل تكيف نموذج تسلسل متطلب مسبقا بمهمة التحقق من المطالبة العلمية في المجال الطبي الطبيعي.نقترح نظام يسمى Vert5erini الذي يستغل T5 لاسترجاع الملخص واختيار الجملة وتنبؤ التسمية، وهي ثلاثة مهام فرعية حرجة للتحقق من الادعاء.نقوم بتقييم خط أناب يبنا في SCIFACT، وهي مجموعة بيانات مفيدة حديثا تتطلب نماذج لا تتوقع فقط عن صحة المطالبات ولكنها توفر أيضا جمل ذات صلة من كائن من الأدبيات العلمية التي تدعم التنبؤ.تجريبيا، يتفوق نظامنا على خط أساس قوي في كل من المهام الفرعية الثلاث.نعرض أيضا قدرة Vert5erini على التعميم لمجموعات بيانات جديدة من مطالبات CovID-19 باستخدام أدلة من Cord-19 Corpus.
نقدم Germeval 2021 المهمة المشتركة بشأن تحديد تعليقات السامة والإخراجية والحقائق. تضم هذه المهمة المشتركة ثلاث مجموعات فرعية تصنيف ثنائية بهدف تحديد: تعليقات سامة، وإشراك التعليقات، والتعليقات التي تشمل مؤشرات على الحاجة إلى فحص الحقائق، يشار إليها ه نا كتعليقات مطالبة بالحقائق. بناء على المهام المشتركة السابقة للجراثيم السابقة بشأن تحديد اللغة الهجومية في عامي 2018 و 2019، نقوم بتوسيع تعريف المهمة لهذا العام لتلبية طلب المشرفين ومديري المجتمع على إبراز التعليقات التي تعزز التواصل المحدد، وتشجيع المناقشات المتعمقة، وتشجيع المناقشات المتعمقة، و تحقق من الحقائق التي تعتمد خطوط الحجج. تشتمل مجموعة البيانات على 4،188 وظيفة مستخرجة من صفحة الفيسبوك لمظهر حديث سياسي ألماني من مذيع تلفزيوني عام وطني. الإطار النظري واختبارات الموثوقية الإضافية خلال عملية شروح البيانات ضمان جودة البيانات عالية بشكل خاص. كانت المهمة المشتركة 15 فريقا مشاركا تقدم 31 أشواط للمشاركة في التعليقات الفرعية بشأن التعليقات السامة، و 25 أشواطا للمتعلقة الفرعية حول إشراك التعليقات، و 31 مقابل الترابط الفرعي على تعليقات المطالبة بالحقائق. يمكن العثور على موقع المهام المشترك في https://germeval2021toxic.github.io/sharedtask/.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا