ترغب بنشر مسار تعليمي؟ اضغط هنا

knowgraph @ iitk في Semeval-2021 المهمة 11: بناء الرسم البياني المعرفة للبحث عن البحوث NLP

KnowGraph@IITK at SemEval-2021 Task 11: Building Knowledge Graph for NLP Research

118   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يبذل الأبحاث في معالجة اللغة الطبيعية تطورات سريعة، مما يؤدي إلى نشر عدد كبير من الأوراق البحثية. العثور على أوراق بحثية ذات صلة ومساهمتها في المجال هي مشكلة صعبة. في هذه الورقة، نتعلم هذا التحدي عبر مهمة Semeval 2021 11: NLPConTributiongraph، من خلال تطوير نظام للحصول على الرسم البياني المعرفة المركزة للصفحة البحثية على أدب معالجة اللغة الطبيعية. تنقسم المهمة إلى ثلاث مهام فرعية: استخراج جمل المساهمة التي توضح مساهمات مهمة في المادة البحثية، واستخراج العبارات من أحكام المساهمة، والتنبؤ بالوحدات الإعلامية في المادة البحثية مع تكوين ثلاثي الأمراض من العبارات. النظام المقترح غير ملائم إلى مجال الموضوع ويمكن تطبيقه لبناء رسم بياني للمعرفة لأي منطقة. وجدنا أن نماذج اللغة القائمة على المحولات يمكن أن تحسن بشكل كبير التقنيات الحالية واستخدام النموذج المستند إلى Scibert. تستخدم المهمة الفرعية الأولى لدينا ثنائي الاتجاه LSTM (Bilstm) مكدسة أعلى طبقات نموذج Scibert، في حين أن المهمة الفرعية الثانية تستخدم مجال عشوائي مشروط (CRF) على رأس Scibert مع Bilstm. تستخدم المهمة الفرعية الثالثة نهجا عصبي مجتمعة مقرها مع الاستدلال لتنبؤ وحدة المعلومات وتشكيل ثلاثي الزيارة من العبارات. حقق نظامنا درجة F1 من 0.38، 0.63 و 0.76 في اختبار خط أنابيب نهاية إلى نهاية، اختبار استخراج العبارات واختبار استخراج ثلاث مرات.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح سلسلة من النماذج العصبية التي تنفذ تصنيف الجملة، والاعتراف العبارة، واستخراج ثلاثي لإجراء المساهمات العلمية تلقائيا من منشورات NLP. لتحديد أحكام المساهمة الأكثر أهمية في ورقة، استخدمنا مصنف مقرا له بالميزات الموضعية (SubTask 1). تم استخدام نموذ ج BERT-CRF للتعرف على العبارات ذات الصلة وتمييزها في جمل المساهمة (SubTask 2). قمنا بتصنيف ثلاث مرات إلى عدة أنواع بناء على ما إذا كانت عناصرها وكيف تم التعبير عن عناصرها في نص، ومعالجتها كل نوع باستخدام مصنفين منفصلين مقرهم بالمقيمين بالإضافة إلى القواعد (SubTask 3). تم تصنيف نظامنا رسميا في المرحلة الأولى في تقييم المرحلة الأولى وأول مرة في كلا جزأين التقييم المرحلة 2. بعد إصلاح خطأ التقديم في PHARESE 1، فإن نهجنا يؤدي إلى أفضل النتائج بشكل عام. في هذه الورقة، بالإضافة إلى وصف للنظام، نقدم أيضا تحليلا إضافيا لنتائجنا، مما يسلط الضوء على نقاط القوة والقيود لها. نجعل شفرةنا متوفرة علنا ​​في https://github.com/liu-hy/nlp-contrib-graph.
تصف هذه الورقة النظام الفائز في مرحلة خطوط الأنابيب الطرفية للمهمة NLPConTribeGraph.يتكون النظام من ثلاث نماذج قائمة على بيرت وتستخدم النماذج الثلاثة لاستخراج الجمل والكيانات والألعاب الثلاثية على التوالي.تظهر التجارب أن أخذ العينات والتدريب الخصم يم كن أن يعزز النظام بشكل كبير.في مرحلة خطوط الأنابيب المناسبة، حصل نظامنا على متوسط F1 من 0.4703، أعلى بكثير من النظام الموضح الثاني الذي حصل على متوسط F1 من 0.3828.
في هذا العمل، نقدم نهجنا ونتائجنا لمهمة Semeval-2021 للكشف عن الفقاعات السامة.كان الهدف الرئيسي للمهمة هو تحديد المواقيات التي يمكن أن تعزى سمية نص معين.المهمة تحديا أساسا بسبب قيود اثنين: مجموعة بيانات التدريب الصغيرة وتوزيع الفئة غير المتوازنة.تقوم ورقتنا بالتحقيق في تقنيين، وتعلم شبه إشراف وتعلم مع فقدان النرد ضبط النفس، لمعالجة هذه التحديات.يتألف نظامنا المقدم (المرتبة التاسعة على متن القائد) من مجموعة من مختلف نماذج اللغة المحولات المدربة مسبقا تدربت باستخدام أي من التقنيات المذكورة أعلاه.
تصف هذه الورقة مساهمتنا في مهمة Semeval 2021 1 (Shardlow et al.، 2021): تنبؤ التعقيد المعجمي.في نهجنا، نستفيد النموذج Electra ومحاولة تعكس نظام شرح البيانات.على الرغم من أن المهمة مهمة الانحدار، إلا أننا نوضح أننا نستطيع التعامل معها كجميع العديد من نماذج التصنيف والانحدار.حقق هذا النهج المضاد بشدة إلى حد ما درجة مياه 0.0654 للمهمة الفرعية 1 و MAE من 0.0811 بشأن المهمة الفرعية 2. بالإضافة إلى ذلك، استخدمنا مفهوم إشارات الإشراف الضعيفة من برت لمعان في عملنا، وتحسن بشكل كبيردرجة ماي في المهمة الفرعية 1.
في الآونة الأخيرة، كان هناك مصلحة في البحث عن التحقق من الواقع والتنبؤ على البيانات المنظمة مثل الجداول والرسوم البيانية. للتحايل على أي حادث أخبار كاذبة، من الضروري عدم النموذج والتنبؤ فقط على البيانات المنظمة بكفاءة ولكن أيضا لشرح تلك التنبؤات. في هذه الورقة، كجزء من مهمة SEMEVAL-2021 9، نتعامل مع مشكلة التحقق من الحقائق وأدلة العثور على بيانات جدولية. هناك نوعان فرعي، حيث نظأ طاولة وبيان / حقيقة، يتمثل الترجمة الفرعية في تحديد ما إذا كان البيان استنتجا من البيانات الجدولية، ويقوم SubTask B بتحديد الخلايا الموجودة في الجدول تقديم أدلة على التراكب الفرعي السابق. نحن نقدم مقارنة بين خطوط الأساس وحالة النهج الفنية على مجموعة بيانات Semtabfact المعينة. نقترح أيضا نهج رواية Cellbert لحل مهمة العثور على الأدلة، كشكل من أشكال مهمة الاستدلال باللغة الطبيعية. نحصل على درجة F1 ذات الاتجاهين من 0.69 على التراكب الفرعي ونتيجة F1 من 0.65 على التراكب الفرعي B.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا