ترغب بنشر مسار تعليمي؟ اضغط هنا

رائع: فحص الحقائق بناء على فهم اللغة على المعلومات غير المنظمة والمنظم

FaBULOUS: Fact-checking Based on Understanding of Language Over Unstructured and Structured information

315   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

كجزء من المهمة المشتركة الحميرة، قمنا بتطوير بنية قوية ومضبوطة بدقة للتعامل مع الاسترجاع المشترك وتتبعها على البيانات النصية وكذلك البيانات الهيكلية مثل الجداول.اقترحنا خططين تدريبي لمعالجة العقبات المتأصلة لمجموعات البيانات متعددة الوسائط متعددة القفزات.أول واحد يسمح بإجراء استرجاع قوي لمجموعات الأدلة الكاملة، في حين أن المرء الثاني يتيح الاستيطاط الاستفادة الكاملة من مدخلات الأدلة الصاخبة.بالإضافة إلى ذلك، كشف عملنا عن رؤى مهمة وسيلة بحثية محتملة للتحسين في المستقبل على هذا النوع من مجموعة البيانات.في التقييم الأولي حول مجموعة اختبار المهام المشتركة الحميرة، يحقق نظامنا 0.271 درجة حمامة، مع استدعاء الأدلة 0.4258 ودقة استقامة 0.5607.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تلقت مهمة التحقق من صحة المطالبات في الوثائق النصية، أو فحص الحقائق، اهتماما كبيرا في السنوات الأخيرة. تحتوي العديد من مجموعات بيانات الحقائق القائمة على الأدلة الموجودة على المطالبات الاصطناعية والنماذج المدربة على هذه البيانات قد لا تتمكن من التحقق من مطالبات العالم الحقيقي. وعليا بعض الدراسات التي تعالجت التحقق من الحقائق القائمة على الأدلة للمطالبات المتعلقة بالصحة التي تتطلب الخبرات الطبية أو الأدلة من الأدبيات العلمية. في هذه الورقة، نقدم صحة، مجموعة بيانات جديدة لفحص الحقائق القائم على الأدلة للمطالبات المتعلقة بالصحة التي تسمح بدراسة صلاحية المطالبات في العالم الحقيقي من خلال تقييم صدقها ضد المقالات العلمية. باستخدام طريقة إنشاء بيانات ثلاث خطوات، استجبت لأول مرة مطالبات عالمية حقيقية من المقتطفات التي تم إرجاعها بواسطة محرك بحث للأسئلة حول CovID-19. ثم استرجاعنا تلقائيا وإعادة صياغة الأوراق العلمية ذات الصلة باستخدام نموذج T5 القائم على الصلة. وأخيرا، تم تفاح العلاقات بين كل بيان أدلة والمطالبة المرتبطة يدويا كدعم ودحض ومحايد. للتحقق من صحة مجموعة البيانات التي تم إنشاؤها من 14،330 أزواج مطالبة الأدلة، طورت نماذج خط الأساس بناء على نماذج اللغة المحددة مسبقا. أظهرت تجاربنا أن التدريبات التدريبية العميقة في المطالبات الطبية في العالم الحقيقي تعمل بشكل كبير على تحسين الأداء مقارنة بالنماذج المدربة على مطالبات الاصطناعية والمفتوحة. تشير النتائج الخاصة بنا والتحليلات اليدوية إلى أن صحية يوفر مجموعة بيانات واقعية وصعبة للجهود المستقبلية بشأن التحقق من الحقائق القائمة على الأدلة للمطالبات المتعلقة بالصحة. تتوفر DataSet، التعليمات البرمجية المصدر، لوحة المتصدرين في https://github.com/sarrouti/healthver.
استخراج الحقائق والتحقق (الحمى) هي مهمة تم تقديمها مؤخرا تتألف من استرجاع المستندات الفرعية التالية (I)، (II) استعادة الجملة، و (3) التحقق من المطالبة.في هذا العمل، نركز على الترجمة الفرعية لاسترجاع الجملة.على وجه التحديد، نقترح نموذجا يعتمد على المح ولات على الأدلة التي تتفوق على جميع الطرز الأخرى من حيث درجة الحمى باستخدام مجموعة فرعية من مثيلات التدريب.بالإضافة إلى ذلك، نقوم بإجراء دراسة تجريبية كبيرة للحصول على فهم أفضل للمشكلة، بينما تلخص نتائجنا من خلال تقديم تحديات البحث في المستقبل.
تسأل الأسئلة الحديثة الإجابة على معايير القراءة والآلة في كثير من الأحيان تقلل من المهمة إلى واحدة من 12 يمتد في مقطع نص معين يجيب على السؤال المحدد. عادة ما تكون هذه النظم غير مطلوبة لفهم النص على مستوى أعمق يسمح بالتفكير الأكثر تعقيدا في المعلومات الواردة. نقدم مجموعة بيانات جديدة تسمى BIQUAD التي تتطلب فهم أعمق من أجل الإجابة على الأسئلة بطريقة استخراجية وملىذة. تتكون DataSet من 4،190 نص مغلقا ومما مجموعه 99،149 زوجا للإجابة على الأسئلة. تقوم النصوص بتوليد تقارير مباراة كرة القدم التي تنشط الأحداث الرئيسية لكل مباراة. تتم مصحوبة جميع النصوص برامج Datalog منظمة تمثل نموذجا (منطقي) من معلوماتها. نظهر أن طرازات ضمان الجودة لا تعمل بشكل جيد على سياقات النموذج الطويلة الصعبة ومتطلبات التفكير التي تطرحتها مجموعة البيانات. على وجه الخصوص، تحقق النماذج القائمة على المحولات الموجودة على النتائج F1 من 39.0 فقط. نوضح كيف تحاكي مجموعات البيانات الاصطناعية هذه المعرفة المهيكلة بالنص الطبيعي وتأمل نموذج المساعدة عند الاقتراب من فهم النص المعقد.
في هذه الورقة، نقترح نظام التحقق والتحقق من حقائق جديدة للتحقق من مطالبات محتوى ويكيبيديا.يسترد نظامنا صفحات ويكيبيديا ذات الصلة باستخدام Anserini، ويستخدم نموذج الإجابة على السؤال من Bert-Bert-bert-Berted لتحديد الأدلة الصحيحة، وتحقق من المطالبات با ستخدام نموذج الاستدلال باللغة الطبيعية XLNet بمقارنتها بالأدلة.يتم الحصول على أدلة خلية الجدول من خلال البحث عن قيم الخلايا المطابقة للكيان وسؤال الجدول Tapas نموذج الرد على نموذج.يستخدم خط الأنابيب إمكانيات الطلقة الصفرية للنماذج الحالية وجميع النماذج المستخدمة في خط الأنابيب لا يتطلب أي تدريب إضافي.حصل نظامنا على درجة حمامة من 0.06 ودقة ملصقة تبلغ 0.39 في التحدي الحمير.
مستوحاة من اختيار ميزة المعلومات المتبادلة (MI) في الانحدار اللوجستي، في هذه الورقة، نقترح تشذيب الطبقة المستندة إلى MI: لكل طبقة من الشبكة العصبية متعددة الطبقات، الخلايا العصبية ذات القيم العالية في MI فيما يتعلق يتم الحفاظ على الخلايا العصبية المح فوظة في الطبقة العليا. بدءا من أعلى طبقة SoftMax، تتقلص الطبقة الحكيمة في الأزياء من أعلى إلى أسفل حتى تصل إلى طبقة تضمين الكلمة السفلي. تقدم استراتيجية التذكير المقترحة مزايا تقنيات تشذيب الوزن: (1) يتجنب الوصول إلى الذاكرة غير النظامية لأن التمثيلات والمصفوفات يمكن الضغط عليها في نظرائها الأصغر ولكن الكثيف، مما يؤدي إلى زيادة السرعة؛ (2) بطريقة تشذيب من أعلى إلى أسفل، تعمل الطريقة المقترحة من منظور عالمي أكثر استنادا إلى إشارات تدريبية في الطبقة العليا، والحكومة كل طبقة من خلال نشر تأثير الإشارات العالمية من خلال الطبقات، مما يؤدي إلى أداء أفضل في نفس مستوى Sparsity. تظهر تجارب واسعة أنه على مستوى Sparsity نفسه، فإن الاستراتيجية المقترحة تقدم كل من التطورات العالية والأداء أعلى من طرق تشذيب الوزن (على سبيل المثال، تشذيب الحجم، تقليم الحركة).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا