ترغب بنشر مسار تعليمي؟ اضغط هنا

اكتسب فحص الحقائق الحاسوبية الكثير من الجر في مجتمعات تعلم الآلات ومعالجة اللغة الطبيعية.تم تطوير عدد كبير من الحلول، لكن الأساليب التي تستفيد من كل من المعلومات الهيكلية وغير المنظمة للكشف عن المعلومات الخاطئة ذات أهمية خاصة.في هذه الورقة، نتعامل مع التحدي الحمير (استخراج الحقائق والتحقق من المعلومات غير المنظمة والمعلومات المهيكلة) التي تتكون من نظام أساسي من المصدر مفتوح مع مجموعة بيانات معيار تحتوي على 87،026 مطالبات تم التحقق منها.نقوم بتمديد هذا النموذج الأساسي هذا من خلال تحسين وحدة استرجاع الأدلة التي تسفر عن أفضل دليل F1 بين المنافسين في لوحة المتصدرين التحدي أثناء الحصول على درجة حمامة إجمالية قدرها 0.20 (أفضل نظام في المرتبة الخامسة).
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن الأخبار المزيفة. في حين أن معظم الأعمال ومجموعات البيانات المتاحة للكشف عن الموقف يعالج النصوص القصيرة مقتطفات مستخرجة من الحوارات النصية، أو منصات وسائل التواصل الاجتماعي، أو عناوين الأخبار مع التركيز القوي على اللغة الإنجليزية، فهناك نقص في الموارد المستهدفة للنصوص الطويلة بلغات أخرى. مساهمتنا في هذه الورقة هي ذات شقين. أولا، نقدم مجموعة بيانات ألمانية من أسئلة النقاش والمقالات الإخبارية التي يتم تفاحها يدويا للكشف عن الموقف والعاطفة. ثانيا، نستفيد من مجموعة البيانات لمعالجة المهمة الخاضعة للإشراف على تصنيف موقف مقال إخباري فيما يتعلق بمسألة النقاش وتوفير نماذج خط الأساس كمرجع للعمل في المستقبل بشأن اكتشاف الموقف في المقالات الإخبارية الألمانية.
اجتذبت التحقق من الحقائق التلقائي اهتماما بالبحوث الحديثة باعتباره نشر متزايد للتضليل على منصات وسائل التواصل الاجتماعي.تقدم المهمة المشتركة الحميرة معيارا للتحقق من الحقائق، حيث يتم تحدي النظام للتحقق من المطالبة المعينة باستخدام العناصر الواضحة الم ستخرجة من وثائق ويكيبيديا.في هذه الورقة، نقترح نظامنا الثالث الذي يتكون نظامنا الثالث من ثلاثة مراحل يتكون من استرجاع المستندات، واسترجاع العناصر، والاستدلال الحكم للمهمة المشتركة الحمية.من خلال النظر في أهمية السياق في مهمة استخراج الحقائق والتحقق، فإن نظامنا يحقق 0.29 درجة حمامة على مجموعة التطوير و 0.25 درجة حمامة على مجموعة الاختبار العمياء، سواء تتفوق على خط الأساس الحمير.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا