ترغب بنشر مسار تعليمي؟ اضغط هنا

نقوم بتطوير نظام لمهمة استخراج الحقائق الحميرة والتحقق من تحديد مجموعة أولية من الأدلة المحتملة، ثم يتابع الأدلة المفقودة في القفزات اللاحقة من خلال محاولة توليدها، مع وجود وحدة توقعات القفز التالية "التي يتم مطابقة خرجها من عناصر الصفحاتمقال متوقع.ت سعى للحصول على أدلة مع وحدة تنبؤ القفز التالية تستمر في تحسين النتيجة الحميرة لمدة تصل إلى سبع قفزات.يتم تدريب تصنيف العلامات على سلاسل الأدلة المستخرجة غير كاملة غير كاملة، واستخدام تلميحات التي تسهل المقارنة العددية.يحقق النظام .281 النتيجة الحميرة ودقة التسمية .658 على مجموعة التطوير، وينتهي في المرتبة الثانية باستخدام 0.259 درجة حمامة ودقة التسمية .576 على مجموعة الاختبار.
العثور على التعريفي للبيانات هو مفتاح العديد من المهام، بما في ذلك توليد المضادة.إننا نبني نظام، بالنظر إلى بيان، يسترد معرفا من مصادر متنوعة على الويب.في صميم هذا النظام هو نموذج لاستدلال اللغة الطبيعية (NLI) يحدد ما إذا كانت الجملة المرشحة زاوية سا رية المفعول أم لا.ومع ذلك، فإن معظم نماذج NLI حتى الآن، تفتقر إلى قدرات التفكير المناسبة اللازمة لإيجاد التعدد الزيادة التي تنطوي على استنتاج معقد.وبالتالي، نقدم نموذج NLI المحسن للمعرفة يهدف إلى التعامل مع الاستدلال المستندة إلى السببية والمثال من خلال دمج رسوم البيانية المعرفة.تتفوق نموذج NLI الخاص بنا على خطوط الأساس لمهام NLI، خاصة بالنسبة للحالات التي تتطلب الاستدلال المستهدف.بالإضافة إلى ذلك، يحسن نموذج NLI هذا نظام استرجاع معرفي، وخاصة إيجاد مزايا معقدة بشكل أفضل.
إن جمعية الأدلة في القضايا الجنائية تقسم مجموعة من الأدلة القضائية في العديد من مجموعات فرعية غير متداخلة، وتحسين إمكانية الترجمة الشفوية والشرعية في الإدانة.مريح، أدلة مقسمة إلى نفس المجموعة الفرعية عادة ما تدعم نفس المطالبة.لذلك، نقترح طريقة تعليمي ة مزدوجة مدفوعة بالحجة لحساب المسافة بين أزواج الأدلة لخطوة نقابة الأدلة التالية في هذه الورقة.النتائج التجريبية على مجموعة بيانات عالمية حقيقية توضح فعالية طريقتنا.
تلقت مهمة التحقق من صحة المطالبات في الوثائق النصية، أو فحص الحقائق، اهتماما كبيرا في السنوات الأخيرة. تحتوي العديد من مجموعات بيانات الحقائق القائمة على الأدلة الموجودة على المطالبات الاصطناعية والنماذج المدربة على هذه البيانات قد لا تتمكن من التحقق من مطالبات العالم الحقيقي. وعليا بعض الدراسات التي تعالجت التحقق من الحقائق القائمة على الأدلة للمطالبات المتعلقة بالصحة التي تتطلب الخبرات الطبية أو الأدلة من الأدبيات العلمية. في هذه الورقة، نقدم صحة، مجموعة بيانات جديدة لفحص الحقائق القائم على الأدلة للمطالبات المتعلقة بالصحة التي تسمح بدراسة صلاحية المطالبات في العالم الحقيقي من خلال تقييم صدقها ضد المقالات العلمية. باستخدام طريقة إنشاء بيانات ثلاث خطوات، استجبت لأول مرة مطالبات عالمية حقيقية من المقتطفات التي تم إرجاعها بواسطة محرك بحث للأسئلة حول CovID-19. ثم استرجاعنا تلقائيا وإعادة صياغة الأوراق العلمية ذات الصلة باستخدام نموذج T5 القائم على الصلة. وأخيرا، تم تفاح العلاقات بين كل بيان أدلة والمطالبة المرتبطة يدويا كدعم ودحض ومحايد. للتحقق من صحة مجموعة البيانات التي تم إنشاؤها من 14،330 أزواج مطالبة الأدلة، طورت نماذج خط الأساس بناء على نماذج اللغة المحددة مسبقا. أظهرت تجاربنا أن التدريبات التدريبية العميقة في المطالبات الطبية في العالم الحقيقي تعمل بشكل كبير على تحسين الأداء مقارنة بالنماذج المدربة على مطالبات الاصطناعية والمفتوحة. تشير النتائج الخاصة بنا والتحليلات اليدوية إلى أن صحية يوفر مجموعة بيانات واقعية وصعبة للجهود المستقبلية بشأن التحقق من الحقائق القائمة على الأدلة للمطالبات المتعلقة بالصحة. تتوفر DataSet، التعليمات البرمجية المصدر، لوحة المتصدرين في https://github.com/sarrouti/healthver.
عملية التحقق من المطالبة تحديا لأنها تتطلب أولا العثور على أدلة نصية ثم قم بتطبيق تستيط أدلة المطالبة للتحقق من مطالبة.تقوم Works السابقة بتقييم خطوة الاستقبال استنادا إلى الأدلة المستردة، في حين أننا نفترض أن التنبؤ الاستيباري يمكن أن يوفر إشارات مف يدة لاسترجاع الأدلة، بمعنى أنه إذا كانت الجملة تدعم مطالبة أو يجب أن تكون الجملة ذات صلة.نقترح نموذج جديد يستخدم النتيجة الاستقبال للتعبير عن الملاءمة.تجاربنا تحقق من أن الاستفادة من التنبؤ التنفيذ يحسن الترتيب قطع متعددة من الأدلة.
يتم استخدام الجداول على نطاق واسع في أنواع مختلفة من المستندات لتقديم المعلومات بإيجاز. يعد فهم الجداول مشكلة صعبة تتطلب فهم لغة اللغة والجدول، إلى جانب التفكير العددي والمنطقي. في هذه الورقة، نقدم أنظمتنا لحل المهمة 9 من Semeval-2021: التحقق من البي ان وإصدار الأدلة مع الجداول (SEM-Tab-Facts). تتكون المهمة من اثنين من المهام: (أ) بالنظر إلى جدول وبيان، يتوقع ما إذا كان الجدول يدعم البيان و (ب) التنبؤ بالخلايا الموجودة في الجدول تقديم أدلة على / ضد البيان. نحن نايت Tune Tapas (نموذج يمتد بنية بيرت لالتقاط بنية جدولي) لكل من المهام الفرعية حيث أظهرت أداء حالة من بين الفن في مهام فهم الجدول المختلفة. في SubTask a، نقيم كيفية نقل التعلم وتوحيد الجداول للحصول على صف رأس واحد يحسن أداء Tapas. في SubTask B، نقيم مدى اختلاف استراتيجيات ضبط التوصيل المختلفة تحسين أداء Tapas. حقق أنظمتنا درجة F1 من 67.34 في التراكب الفرعي تصنيف ثلاثي الاتجاه، 72.89 في فرعية تصنيف ثنائية الاتجاه، و 62.95 في الفرعية B.
في الآونة الأخيرة، كان هناك مصلحة في البحث عن التحقق من الواقع والتنبؤ على البيانات المنظمة مثل الجداول والرسوم البيانية. للتحايل على أي حادث أخبار كاذبة، من الضروري عدم النموذج والتنبؤ فقط على البيانات المنظمة بكفاءة ولكن أيضا لشرح تلك التنبؤات. في هذه الورقة، كجزء من مهمة SEMEVAL-2021 9، نتعامل مع مشكلة التحقق من الحقائق وأدلة العثور على بيانات جدولية. هناك نوعان فرعي، حيث نظأ طاولة وبيان / حقيقة، يتمثل الترجمة الفرعية في تحديد ما إذا كان البيان استنتجا من البيانات الجدولية، ويقوم SubTask B بتحديد الخلايا الموجودة في الجدول تقديم أدلة على التراكب الفرعي السابق. نحن نقدم مقارنة بين خطوط الأساس وحالة النهج الفنية على مجموعة بيانات Semtabfact المعينة. نقترح أيضا نهج رواية Cellbert لحل مهمة العثور على الأدلة، كشكل من أشكال مهمة الاستدلال باللغة الطبيعية. نحصل على درجة F1 ذات الاتجاهين من 0.69 على التراكب الفرعي ونتيجة F1 من 0.65 على التراكب الفرعي B.
تصف هذه الورقة نهجنا للمهمة 9 من Semeval 2021: التحقق من البيان وإصدار الأدلة مع الجداول.شاركنا في كل من المجموعات الفرعية، أي بيان التحقق من البيان وإيجاد الأدلة.بالنسبة إلى المراكز الفرعية للتحقق من العبارات، نقوم بتوسيع نموذج Tapas للتكيف مع فئة ا لبيانات المجهولة من خلال Finet Inetuning عليه في إصدار معدات من بيانات المهمة.للحصول على الترجمة الفرعية للنتيجة الأدلة، نحن Finetune نموذج التوريد في إعداد سيامي.
استخراج الحقائق والتحقق (الحمى) هي مهمة تم تقديمها مؤخرا تتألف من استرجاع المستندات الفرعية التالية (I)، (II) استعادة الجملة، و (3) التحقق من المطالبة.في هذا العمل، نركز على الترجمة الفرعية لاسترجاع الجملة.على وجه التحديد، نقترح نموذجا يعتمد على المح ولات على الأدلة التي تتفوق على جميع الطرز الأخرى من حيث درجة الحمى باستخدام مجموعة فرعية من مثيلات التدريب.بالإضافة إلى ذلك، نقوم بإجراء دراسة تجريبية كبيرة للحصول على فهم أفضل للمشكلة، بينما تلخص نتائجنا من خلال تقديم تحديات البحث في المستقبل.
لاشك أن التطورات العلمية المتقدمة التي ظهرت على الساحة في العصر الحديث، قد أحدثت متغيرات جذرية في وسائل الإثبات الجنائي لم تكن معروفة من قبل، و ذلك اعتماداً على النظريات العلمية، و كان لنتائج الأبحاث العلمية و استخداماتها في مجال التحقيق الجنائي ا لدور الكبير في إثبات الجريمة وصلتها بمرتكبها، و لهذا، و للوصول إلى أفضل النتائج، كان ضرورياً تنظيم جهاز متخصص في الحصول على الأدلة العلمية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا