ترغب بنشر مسار تعليمي؟ اضغط هنا

تمريرة أخرى: دراسة استنساخ للتقييم البشري لنظام توليد تقرير كرة القدم

Another PASS: A Reproduction Study of the Human Evaluation of a Football Report Generation System

222   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تنتج هذه التقارير الورقية من دراسة الاستنساخ التي نكررت فيها التقييم البشري لنظام توليد تقرير كرة القدم الهولندي باللغة الهولندية (Van der Lee et al.، 2017). تم تنفيذ العمل كجزء من المهمة المشتركة لإعادة التوبيخ بشأن استنساخ التقييمات البشرية في NLG، في المسار الصحيح (ورقة 1). نهدف إلى تكرار الدراسة الأصلية بالضبط، مع الفرق الرئيسي الذي تم استخدام مجموعة مختلفة من المقيمين. نحن تصف تصميم الدراسة، وتقديم النتائج من دراسة النسخ الأصلية، ثم قارن وتحليل الاختلافات بين مجموعتين من النتائج. بالنسبة لنتائج المعتديين الأولين من الطلاقة والوضوح، نجد أنه في كلتا الدراسات، تم تصنيف النظام بشكل أكبر من أجل الوضوح أكثر من الطلاقة، وكان الوضوح انحراف معياري أعلى. كانت تصنيفات الوضوح والطلاقة أعلى، وانحرافاتها المعيارية أقل، في دراسة الاستنساخ أكثر من الدراسة الأصلية من الهوامش الكبيرة. كان الوضوح درجة أعلى من الاستيلاء من الطلاقة، كما تقاس معامل الاختلاف. البيانات والرمز متاحة للجمهور.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

التقييم البشري التجريدي لأنظمة الترجمة عالية الجودة الحديثة هي مشكلة صعبة، وهناك أدلة متزايدة على أن إجراءات التقييم غير الكافية يمكن أن تؤدي إلى استنتاجات خاطئة. بينما كان هناك بحث كبير في التقييم البشري، لا يزال الحقل يفتقر إلى إجراء قياسي شائع. كخ طوة نحو هذا الهدف، نقترح منهجية تقييم في تحليل خطأ صريح، استنادا إلى إطار مقاييس الجودة متعددة الأبعاد (MQM). نحن نفذت أكبر دراسة بحثية MQM حتى الآن، وتسجيل مخرجات الأنظمة العليا من المهمة المشتركة WMT 2020 في أزواج لغتين باستخدام التعليقات التوضيحية المقدمة من المترجمين المحترفين مع الوصول إلى سياق المستند الكامل. نقوم بتحليل البيانات الناتجة على نطاق واسع، والعثور على نتائج أخرى بمثابة ترتيب مختلف تماما للأنظمة المقدرة من تلك المنشأة من قبل عمال الحشد WMT، تعرض تفضيل واضح لإخراج الإنسان على الجهاز. من المستغرب، نجد أيضا أن المقاييس التلقائية القائمة على المدينات المدربة مسبقا يمكن أن تفوق عمال الحشد البشري. نحن نجعل كوربوس متاحة علنا ​​لمزيد من البحث.
تعد طاقة الرياح و الشمس من أهم مصادر الطاقة المتجددة بسبب وفرتها و اقتصاديتها, و يمكن الاستفادة من هذين المصدرين للطاقة المتجددة في منطقة قطينة التابعة لمحافظة حمص, لتصميم و بناء نظام طاقة كهربائي ثنائي المصادر (شمسي - ريحي) سيتم الاعتماد على المنحني اليومي لكل من سرعة الرياح و شدة الإشعاع الشمسي للمنطقة المدروسة. تمَّ في هذا البحث دراسة تصميم نظام شمسي ريحي هجين باختيار مكوناته المتوفرة في السوق المحلية لجهة مواصفاتها الاسمية الفنية, و ذلك استناداً على الدراسات الفنية و الاقتصادية, و المعايير العالمية الموافقة. أظهرت النتائج التي حصلنا عليها أن لدينا فائض خلال العام حوالي (1246.7 Kw/Year) لصالح المستهلك, مما يجعل النظام مجدي اقتصاديا من الناحية الاستثمارية, كما اظهر البحث أنه بحاجة لمصدر إضافي لتغذية الحمولة و شحن المدخرات باستطاعة 3360.2 W/Day)) بما يشكل (50.4%) من حجم الحمولة. إضافة إلى النتائج العملية فانه يقدم قاعدة بيانات نظرية سواء للباحث أو للمستثمر في مجال الطاقات المتجددة و خصوصاً لجهة كفاءة اختيار مكونات النظام.
نسأل الموضوعات سواء كانوا ينظرون إلى وجود مجموعة من النصوص، وبعضها مكتوب بالفعل، في حين يتم إنشاء آخرين تلقائيا.نحن نستخدم هذه البيانات لضبط نموذج GPT-2 لدفعه لتوليد المزيد من النصوص التي يشبه الإنسان، ومراقبة أن هذا النموذج الذي تم ضبطه بشكل جيد ينت ج نصا يشوه بالفعل أكثر من النموذج الأصلي.سيحري، نظهر أن استراتيجية التقييم التلقائي لدينا ترتبط جيدا بأحكام بشرية.كما ندير تحليل لغوي تكشف عن خصائص اللغة التي تتسم بها الإنسان.
احتلت الرياضة الاحترافية مكانا بارزا في الحياة العامة في القرن الماضي، و خصوصاً كرة القدم التي أصبحت أكثر رياضة شعبية في العالم كله، لهذا الغرض تم بناء و تطوير الملاعب الرياضية (الاستادات) لتكون مركزا تقام فيه الأحداث الرياضية و لتستوعب أكبر عدد م ن الجميور المتابع لها. و لتلبية حاجات هذا الجمهور و متطلباته المتزايدة (راحة، وصول سهل، حماية .....)مما شكل تحد للمصممين و الإنشائيين لتصميم ملعب يلبي هذه الاحتياجات و يشكل صرحاً حضارياً من الناحية الجمالية و الإنشائية و التقنية. يتناول هذا البحث ملاعب كرة القدم و تطورها عبر التاريخ و أسس تصميمها (المبادئ الأساسية في التصميم-سرعة تفريغ المدرجات-العوامل الخارجية المؤثرة) و توصيات الفيفا في مجال تصميم و انشاء الملاعب الرياضية (الأمور الواجب اعتبارها أثناء عملية التصميم-موقع الملعب) و إلى أهم الأساليب الإنشائية المستخدمة في تغطية الملاعب الرياضية (الدعامة و الجائز-الدعامة الهدف-الإنشاء الكابولي-القشريات الخرسانية- حلقات الشد و الضغط-الشدادات-المنشآت المنفوخة-الإطارات الفراغية-السقوف القابلة للفتح) و المواد المستخدمة في التغطية ، بحيث يشكل دليلاً مبسطاً يغطي جميع النواحي التصميمية و الإنشائية.
هذه الاستعراضات الورقة وتلخص ممارسات التقييم البشري الموضحة في 97 ورقة نقل النمط فيما يتعلق بثلاثة جوانب التقييم الرئيسية: نقل النمط، والمعنى بالحفظ، والطلاقة.من حيث المبدأ، يجب أن تكون التقييمات من قبل راتبي البشر هي الأكثر موثوقية.ومع ذلك، في أوراق نقل النمط، نجد أن بروتوكولات التقييمات البشرية غالبا ما تكون غير محددة وغير موحدة، والتي تعيق استنساخ البحث في هذا المجال والتقدم نحو أساليب تقييم بشرية وتلقائية أفضل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا