نقدم إجراء منهجي لقرار الخلاف الدولي.الإجراء عام، ولكن الاستخدام بشكل خاص في مهام التعليق المتعددة موجهة نحو بناء الحقيقة الأرضية.نقوم بحفز اقتراحنا من خلال القول بأن هدف الحالات التي يحظر فيها هدف الباحثين هو استنباط نقاط وجهة نظر مختلفة، فإن الخلاف القاطع هو علامة على ضعف الجودة في التصميم أو وصف المهمة.إجماع في الآراء بين المحن المعلقين، نحافظ، يجب أن ينتضل، من خلال إجراء منهجي لحل الخلاف مثل الوصف الذي نصفه.
We present a systematic procedure for interrater disagreement resolution. The procedure is general, but of particular use in multiple-annotator tasks geared towards ground truth construction. We motivate our proposal by arguing that, barring cases in which the researchers' goal is to elicit different viewpoints, interrater disagreement is a sign of poor quality in the design or the description of a task. Consensus among annotators, we maintain, should be striven for, through a systematic procedure for disagreement resolution such as the one we describe.
المراجع المستخدمة
https://aclanthology.org/
تظهر هذه الورقة أن عصير التفاح، مقياس التقييم التقليدي لوصف الصورة، لا يعمل بشكل صحيح على مجموعات البيانات حيث يكون عدد الكلمات في الجملة أكبر بكثير من تلك الموجودة في مجموعة بيانات التسميات التوضيحية MS COCO.نظهر أيضا أن CIDER-D لديه أداء يعوقه عدم
إن الاستدلال اللغوي الطبيعي (NLI) هي مهمة تحديد ما إذا كان جزء من النص ينطوي أو يتناقض أو لا علاقة له بقطعة أخرى من النص.في هذه الورقة، نحقق في كيفية ندف الاستنتاجات المنهجية (أي، العناصر التي يتفق بها الناس على تسمية NLI) بصرف النظر عن عناصر الخلاف
من النماذج الإحصائية إلى النماذج العصبية، تم اقتراح مجموعة واسعة من خوارزميات نمذجة الموضوعات في الأدب. ومع ذلك، بسبب تنوع مجموعات البيانات والمقاييس، لم تكن هناك العديد من الجهود لمقارنة أدائها بشكل منهجي على نفس المعايير وتحت نفس الشروط. في هذه الو
هدف هذا البحث إلى دراسة سلوك المواد القاصرة فوق الأكسجينية (فوق كربونات الصوديوم،
فوق بورات الصوديوم أحادية الماء، فوق بورات الصوديوم رباعية الماء) ضمن صيغة المسحوق
المنظف منخفض الرغوة من حيث نسبة تفككها، بوجود المنشط ودون وجود منشط، عند درجات حرار
Semeval هو المكان الرئيسي في مجتمع NLP لاقتراح التحديات الجديدة والتقييم التجريبي المنهجي لأنظمة NLP.توفر هذه الورقة تحليلا قياسيا منهيا لسيميفال تهدف إلى الأدلة على أنماط المساهمات وراء Semeval.من خلال فهم توزيع أنواع المهام والمقاييس والبنية والمشا