ترغب بنشر مسار تعليمي؟ اضغط هنا

استخراج الرسوم البيانية المعرفة الحبيبات الدقيقة للمطالبات العلمية: النتائج المستندة إلى DataSet

Extracting Fine-Grained Knowledge Graphs of Scientific Claims: Dataset and Transformer-Based Results

330   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تظهر النهج الحديثة القائمة على المحولات نتائج واعدة على استخراج المعلومات العلمية العلائقية. تركز مجموعات البيانات الحالية على وصف رفيع المستوى لكيفية تنفيذ البحث. بدلا من ذلك، نركز على التفاصيل الدقيقة لكيفية تقديم الرابطات التجريبية من خلال بناء SCICLAIL، وهي مجموعة بيانات من المطالبات العلمية المستمدة من أوراق العلوم الاجتماعية والسلوكية (SBS)، PubMed، وحالات الحبل 19. يشتمل مخطط شرح الرسم البياني الربيعي على أن الكيانات الخشنة فقط يمتد كعقد العقد والعلاقات كحواف بينهما، ولكن أيضا سمات الحبيبات الدقيقة التي تعدل الكيانات وعلاقاتها، لما مجموعه 12738 ملميا في الشئ. من خلال إدراج المزيد من أنواع الملصقات وأكثر من ضعف كثافة التسمية من مجموعات البيانات السابقة، يلتقط SCICIMAL مع الجمعيات السببية والمقارنة والتنبؤ والإحصائية والتناسبية على المتغيرات التجريبية إلى جانب مؤهلاتهم وسلعيتهم وأدليلهم. نحن نقوم بتوسيع العمل في كيان مشترك ومقرها المحول واستخراج العلاقات لاستنتاج مخططنا بشكل فعال، مما يدل على وعد الرسوم البيانية المعرفة بحبائها الجميلة في المطالبات العلمية وما بعدها.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يهدف كتابة كيان الرسم البياني للمعرفة إلى أن ينتج أنواع الكيانات المفقودة في الرسوم البيانية المعرفة التي تعد قضية مهمة ولكنها غير مستحقة.تقترح هذه الورقة طريقة رواية لهذه المهمة من خلال الاستفادة من المعلومات السياقية للكيانات.على وجه التحديد، نقوم بتصميم آليات الاستدلال: I) N2T: استخدام كل جار كل جار بشكل مستقل لاستنتاج نوعه؛2) AGG2T: إجمالي جيران كيان لاستنتاج نوعها.ستنتج هذه الآليات نتائج الاستدلال المتعددة، وتستخدم طريقة تجميع مضاعفة بشكل كبير لتوليد نتيجة الاستدلال النهائي.علاوة على ذلك، نقترح وظيفة خسارة جديدة لتخفيف المشكلة السلبية الخاطئة أثناء التدريب.تجارب على اثنين من كلغ العالم الحقيقي توضح فعالية طريقتنا.يمكن الحصول على شفرة المصدر وبيانات هذه الورقة من https://github.com/cciiplab/cet.
تصميم التمثيلات التعبيرية للكيانات والعلاقات في الرسم البياني المعرفي هو مسعى مهم. في حين أن العديد من الأساليب الحالية تركز بشكل أساسي على التعلم من الأنماط العلائقية والمعلومات الهيكلية، فقد تم تجاهل التعقيد الجوهري لكي كيانات KG أكثر أو أقل. بشكل أكثر ملاءمة، نفترض كيانات KG قد تكون أكثر تعقيدا مما نعتقد، أي، قد يرتدي الكيان العديد من القبعات والأحدث العلائقية قد تشكل بسبب أكثر من سبب واحد. تحقيقا لهذه الغاية، تقترح هذه الورقة التعلم من تمثيلات DESENTANGLED من كيانات كيغ كيغ - وهي طريقة جديدة تقوم بتخفيف الخصائص الكامنة الداخلية لكي كيانات كيغ كيانات. تعمل عملية DESTANGLED الخاصة بنا على مستوى الرسم البياني ويتم الاستفادة من آلية الحي لزيادة الخصائص المخفية لكل كيان. هذا النهج التعلم في التمثيل هذا هو نموذج غير مرجح ومتوافق مع نهج Enonical KG Adgedding. نقوم بإجراء تجارب مكثفة على العديد من مجموعات البيانات القياسية، تجهيز مجموعة متنوعة من النماذج (الإقصاء، بسيطة، والقلق) مع آلية DESTANGLING المقترحة. توضح النتائج التجريبية أن نهجنا المقترح يحسن الأداء بشكل كبير على المقاييس الرئيسية.
أحدثت النماذج المدربة (E2E) مؤخرا (E2E) لصالح الإجابة على الرسوم البيانية المعرفة (KGQA) نتائج واعدة تستخدم فقط مجموعة بيانات خاضعة للإشراف.ومع ذلك، يتم تدريب هذه النماذج وتقييمها في وضع يتم فيه توفير كيانات سؤال مشروح يدوية للنموذج، مما يترك المهمة المهمة وغير التافهة لقرار الكيان (ER) خارج نطاق تعلم E2E.في هذا العمل، نقوم بتوسيع حدود التعلم E2E ل KGQA لتضمين تدريب مكون ER.يحتاج النموذج الخاص بنا فقط إلى نص الأسئلة والكيانات الإجابة لتدريب، وتوفر نموذج ضمان الجودة المستقل لا يتطلب توفير مكون إضافي ER أثناء وقت التشغيل.نهجنا هو قابل له تماما، وذلك بفضل اعتماده على طريقة حديثة لبناء KGS الفائقة (كوهين وآخرون، 2020).نقوم بتقييم نموذج E2E المدربين على مجموعة بيانات عامين وإظهار أنه يقترب من النماذج الأساسية التي تستخدم الكيانات المشروح اليدوية.
مع زيادة الطفرة الأخيرة في التطبيقات الاجتماعية التي تعتمد على الرسوم البيانية المعرفة، أصبحت الحاجة إلى التقنيات لضمان الإنصاف في الأساليب القائمة على KG واضحة بشكل متزايد. أظهرت الأعمال السابقة أن كلية كجمها عرضة للحيوانات الاجتماعية المختلفة، وقد اقترحت طرق متعددة لدخاناتها. ومع ذلك، في مثل هذه الدراسات، كان التركيز على تقنيات deviasing، في حين يتم تحديد العلاقات التي ستكون degiased يدويا من قبل المستخدم. نظرا لأن المواصفات اليدوية هي نفسها عرضة للتحيز الإدراكي البشري، فهناك حاجة إلى نظام قادر على قياس وفضح التحيزات، التي يمكن أن تدعم قرارات أكثر استنارة بشأن ما له ديبي. لمعالجة هذه الفجوة في الأدب، وصفنا إطارا لتحديد التحيزات الموجودة في Adments Graph Admings، بناء على مقاييس BIAS الرقمية. نوضح الإطار بثلاث تدابير تحيز مختلفة حول مهمة التنبؤ بالمهنة، ويمكن امتدت بمرونة لتعريفات وتطبيقات إضافية. يمكن بعد ذلك تسليم العلاقات التي يتم تمييزها على أنها منحازة إلى صانعي القرار للحكم على الدخل اللاحق.
الفهم القراءة الآلة التفاعلية (IMRC) هو مهام فهم الجهاز حيث تكون مصادر المعرفة يمكن ملاحظتها جزئيا.يجب أن يتفاعل الوكيل مع بيئة بالتتابع لجمع المعرفة اللازمة من أجل الإجابة على سؤال.نحن نفترض أن تمثيلات الرسم البياني هي تحيزات حثي جيدة، والتي يمكن أن تكون بمثابة آلية ذاكرة الوكيل في مهام IMRC.نستكشف أربع فئات مختلفة من الرسوم البيانية التي يمكنها التقاط معلومات نصية على مختلف المستويات.نحن تصف الأساليب التي تقوم ببناء وتحديث هذه الرسوم البيانية هذه ديناميكيا أثناء جمع المعلومات، وكذلك النماذج العصبية لتشفير تمثيلات الرسم البياني في وكلاء RL.تشير تجارب واسعة النطاق على ISquad إلى أن تمثيلات الرسم البياني يمكن أن تؤدي إلى تحسينات كبيرة في الأداء لعوامل RL.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا