ترغب بنشر مسار تعليمي؟ اضغط هنا

تقييم حساس للخطأ للمتغيرات المستهدفة الترتيبية

Error-Sensitive Evaluation for Ordinal Target Variables

343   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مراجعات المنتج ومسوحات الرضا البحث عن ملاحظات العملاء في شكل المقاييس المرتبة. في هذه الإعدادات، فإن مقاييس التقييم المستخدمة على نطاق واسع بما في ذلك F1 والدقة تتجاهل المرتبة في الردود (على سبيل المثال، على الأرجح "من المحتمل أن تكون على الأرجح"). في هذه الورقة، نفترض أن ترتيب قيم الفصل مهم لتقييم المصنفين على المتغيرات المستهدفة الترتيبية ويجب عدم الانتهاء. لاختبار هذه الفرضية، قارنا تصنيف التصنيف متعدد الفئة (MC) والانحدار الترتيبي (أو) من خلال تطبيق أو و MC إلى المهام القياسية التي تنطوي على متغيرات مستهدفة ترتيبية باستخدام نفس الهندسة المعمارية الأساسية الأساسية. تظهر النتائج التجريبية أنه في حين أن MC تفوق أو لبعض مجموعات البيانات في الدقة و F1، أو أفضل بكثير من MC لتقليل الخطأ بين التنبؤ والهدف لجميع المعايير، كما هو موضح بواسطة مقاييس حساسة للخطأ، E.G. خطأ متوسط ​​التربيع (MSE) وارتباط سبيرمان. تحفز النتائج الخاصة بنا الحاجة إلى إنشاء مقاييس متسقة حساسة للخطأ لتقييم المعايير مع المتغيرات المستهدفة الترتيبية، ونأمل أن تحفز الاهتمام باستكشاف الخسائر البديلة للمشاكل الترتيبية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

محول غير تلقائي هو نموذج توليد نص واعد.ومع ذلك، لا تزال النماذج الحالية غير التلقائية التي لا تزال تقف وراء نظرائها التلقائي في جودة الترجمة.نحن نعزو فجوة الدقة هذه إلى عدم وجود نمذجة التبعية بين مدخلات فك التشفير.في هذه الورقة، نقترح CNAT، والتي تتع لم الرموز الفئوية الضمنية بمثابة متغيرات كامنة في فك التشفير غير التشغيلي التشغيلي.إن التفاعل بين هذه الرموز الفئوية سيلم على التبعيات المفقودة ويحسن القدرة النموذجية.تظهر نتائج التجربة أن نموذجنا يحقق أداء قابلا أو أفضل في مهام الترجمة الآلية من العديد من خطوط الأساس القوية.
يشهد العصر الحديث تطورا ملموسا في المجالات العلمية كافة وبزيادة هذا التطور تزداد الحاجة إلى الأساليب الإحصائية لحل المشكلات التي تواجه العاملين في هذه المجالات ولاختيار الأسلوب الإحصائي الملائم للتجارب الحياتية يجب اولا التعرف على طبيعة النباتات فعند ما تكون البيانات نوعية اي أن المتحول له أكثر من قيمة فإن هناك عدة نماذج لتمثيل هذا النوع من البيانات منها نموذج تحليل التمايز ونموذج تحليل الانحدار اللوجستي .
تهدف مهمة الكشف عن الموقف إلى اكتشاف موقف سقسقة أو نص للحصول على هدف. يمكن تسمية هذه الأهداف كيانات أو جمل حرة (مطالبات). على الرغم من أن المهمة تنطوي على سبب سقسقة فيما يتعلق بهدف، إلا أننا نجد أنه من الممكن تحقيق دقة عالية على العديد من مجموعات بيا نات الكشف عن موقف تويتر المتوفرة علنا ​​دون النظر إلى الجملة المستهدفة. على وجه التحديد، حقق نموذج تصنيف Tweet بسيط أداء على مستوى بشري على مجموعة بيانات WT - WT وأكثر من دقة ثالثة في مختلف مجموعات البيانات الأخرى. نحن نبحث في وجود تحيزات في مثل هذه البيانات للعثور على الارتباطات الزائفة المحتملة لعلاقات موقد المعنويات والاختيار المعجمي المرتبط بفئة الموقف. علاوة على ذلك، نقترح مجموعة بيانات كبيرة جديدة خالية من هذه التحيزات وإظهار ملصفها على أنظمة الكشف عن الموقف الموجودة. تظهر نتائجنا التجريبية نطاقا كبيرا للبحث عن مهمة الكشف عن الموقف ويقترح العديد من الاعتبارات لإنشاء مجموعات بيانات الكشف عن الموقف في المستقبل.
يركّز البحث في مطالبه على دراسة تطور الاستثمار الإجمالي، و الاستثمار الزراعي و معرفة طبيعة التغيرات الحاصلة خلال المدة (2000-2011)، و تقويم أداء الاقتصاد السوري، و قدرته على جذب الاستثمارات من عدمه، بالإضافة إلى تحليل العوامل المؤثرة على الاستثمار ال إجمالي، و الاستثمار الزراعي في سورية، باستخدام المنهج الوصفي التحليلي، و التحليل الكمي القياسي. و كان من أهم النتائج التي توصّل إليها البحث: أنّ معدل النمو السنوي لصافي ميزان المدفوعات سالبًا بنحو - 18.35 % و الذي سيترتب عليه تدهور قيمته من عام لآخر، كما تبين من معاملات المرونة الكلية لدالة الاستثمار الاجمالي أنّ زيادة قيمة كل من الصادرات الكلية (X1)، و الاحتياطات الأجنبية (X3)، و العجز في الموازنة العامة للدولة (X8) بنسبة 1% يمكن أن تؤدي معًا إلى زيادة الاستثمار الإجمالي بنسبة 3.5%، في حين بينت معاملات المرونة الكلية لدالة الاستثمار الزراعي أنّ زيادة كل من قيمة الصادرات الاجمالية إلى الناتج القومي الإجمالي (X2)، و الاحتياطات الأجنبية (X3)، و صافي ميزان المدفوعات (X6) بنسبة 1% يمكن أن تؤدي معًا إلى زيادة الاستثمار الإجمالي بنسبة 22.3%، و تعدّ المتغيرات السابقة من أهم العوامل المحدّدة و الموجّهة للاستثمار الاجمالي، و الزراعي في سورية. و بناء عليه يتطلب من الاقتصاد السوري من أجل زيادة استثماراته تهيئة المناخ الاقتصادي، و السياسي للاستثمار، و التنمية الاقتصادية.
تناقش هذه الورقة نهجا قائما على التصنيف لتقييم الترجمة الآلي، بدلا من نهج قائم على الانحدار المشترك في مهمة مقاييس WMT.تعمل الترجمة الآلية الحديثة عادة بشكل جيد ولكن في بعض الأحيان تجعل الأخطاء الحرجة بسبب بعض خيارات كلمة خاطئة فقط.يركز نهجنا القائم على التصنيف على هذه الأخطاء باستخدام العديد من ملصقات نوع الخطأ، لتقييم ترجمة الآلات العملي في عصر الترجمة الآلية العصبية.لقد بذلنا شرحا إضافيا على مجموعات بيانات المقاييس 2015-2017 مع ملصقات الطلاقة والكفاية لتمييز أنواع مختلفة من أخطاء الترجمة من نقاط العرض النحوية والدلسة.نقدم معايير التقييم البشرية لدينا لتطوير Corpus وتجارب التقييم التلقائي باستخدام Corpus.سيتم إتاحة كوربوس التقييم البشري علنا عند النشر.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا