مراجعات المنتج ومسوحات الرضا البحث عن ملاحظات العملاء في شكل المقاييس المرتبة. في هذه الإعدادات، فإن مقاييس التقييم المستخدمة على نطاق واسع بما في ذلك F1 والدقة تتجاهل المرتبة في الردود (على سبيل المثال، على الأرجح "من المحتمل أن تكون على الأرجح"). في هذه الورقة، نفترض أن ترتيب قيم الفصل مهم لتقييم المصنفين على المتغيرات المستهدفة الترتيبية ويجب عدم الانتهاء. لاختبار هذه الفرضية، قارنا تصنيف التصنيف متعدد الفئة (MC) والانحدار الترتيبي (أو) من خلال تطبيق أو و MC إلى المهام القياسية التي تنطوي على متغيرات مستهدفة ترتيبية باستخدام نفس الهندسة المعمارية الأساسية الأساسية. تظهر النتائج التجريبية أنه في حين أن MC تفوق أو لبعض مجموعات البيانات في الدقة و F1، أو أفضل بكثير من MC لتقليل الخطأ بين التنبؤ والهدف لجميع المعايير، كما هو موضح بواسطة مقاييس حساسة للخطأ، E.G. خطأ متوسط التربيع (MSE) وارتباط سبيرمان. تحفز النتائج الخاصة بنا الحاجة إلى إنشاء مقاييس متسقة حساسة للخطأ لتقييم المعايير مع المتغيرات المستهدفة الترتيبية، ونأمل أن تحفز الاهتمام باستكشاف الخسائر البديلة للمشاكل الترتيبية.
Product reviews and satisfaction surveys seek customer feedback in the form of ranked scales. In these settings, widely used evaluation metrics including F1 and accuracy ignore the rank in the responses (e.g., very likely' is closer to likely' than not at all'). In this paper, we hypothesize that the order of class values is important for evaluating classifiers on ordinal target variables and should not be disregarded. To test this hypothesis, we compared Multi-class Classification (MC) and Ordinal Regression (OR) by applying OR and MC to benchmark tasks involving ordinal target variables using the same underlying model architecture. Experimental results show that while MC outperformed OR for some datasets in accuracy and F1, OR is significantly better than MC for minimizing the error between prediction and target for all benchmarks, as revealed by error-sensitive metrics, e.g. mean-squared error (MSE) and Spearman correlation. Our findings motivate the need to establish consistent, error-sensitive metrics for evaluating benchmarks with ordinal target variables, and we hope that it stimulates interest in exploring alternative losses for ordinal problems.
المراجع المستخدمة
https://aclanthology.org/
محول غير تلقائي هو نموذج توليد نص واعد.ومع ذلك، لا تزال النماذج الحالية غير التلقائية التي لا تزال تقف وراء نظرائها التلقائي في جودة الترجمة.نحن نعزو فجوة الدقة هذه إلى عدم وجود نمذجة التبعية بين مدخلات فك التشفير.في هذه الورقة، نقترح CNAT، والتي تتع
يشهد العصر الحديث تطورا ملموسا في المجالات العلمية كافة وبزيادة هذا التطور تزداد الحاجة إلى الأساليب الإحصائية لحل المشكلات التي تواجه العاملين في هذه المجالات ولاختيار الأسلوب الإحصائي الملائم للتجارب الحياتية يجب اولا التعرف على طبيعة النباتات فعند
تهدف مهمة الكشف عن الموقف إلى اكتشاف موقف سقسقة أو نص للحصول على هدف. يمكن تسمية هذه الأهداف كيانات أو جمل حرة (مطالبات). على الرغم من أن المهمة تنطوي على سبب سقسقة فيما يتعلق بهدف، إلا أننا نجد أنه من الممكن تحقيق دقة عالية على العديد من مجموعات بيا
يركّز البحث في مطالبه على دراسة تطور الاستثمار الإجمالي، و الاستثمار الزراعي و معرفة طبيعة التغيرات الحاصلة خلال المدة (2000-2011)، و تقويم أداء الاقتصاد السوري، و قدرته على جذب الاستثمارات من عدمه، بالإضافة إلى تحليل العوامل المؤثرة على الاستثمار ال
تناقش هذه الورقة نهجا قائما على التصنيف لتقييم الترجمة الآلي، بدلا من نهج قائم على الانحدار المشترك في مهمة مقاييس WMT.تعمل الترجمة الآلية الحديثة عادة بشكل جيد ولكن في بعض الأحيان تجعل الأخطاء الحرجة بسبب بعض خيارات كلمة خاطئة فقط.يركز نهجنا القائم