بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

تحديات الجيل: نتائج تقييم الدقة المهمة المشتركة

Generation Challenges: Results of the Accuracy Evaluation Shared Task

1041 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

generation challenges accuracy evaluation shared evaluation shared task تحديات الجيل تقاسم تقييم الدقة تقييم المهمة المشتركة صناعة حمض الفوسفور

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

تركز المهمة المشتركة على تقييم الدقة على التقنيات (كلا اليدين والآلية) لتقييم الدقة الواقعية للنصوص التي تنتجها أنظمة NLG العصبية، في مجال التقارير الرياضية.قدم أربعة فرق تقنيات التقييم لهذه المهمة، باستخدام نهج وتقنيات مختلفة للغاية.طلبت التقديمات الأفضل أداء جيدا في هذه المهمة الصعبة.ومع ذلك، تكافح جميع التقديمات التلقائية للكشف عن الأخطاء الواقعية المعقدة دلالة أو بشكل غير رسمي (على سبيل المثال، بناء على حساب أو استنتاج غير صحيح).

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

735 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقدم هذه الورقة نتائج المهمة المشتركة للمقاييس WMT21. طلب من المشاركين تسجيل مخرجات أنظمة الترجمة المتنافسة في مهمة الترجمة الأخبار WMT21 مع مقاييس أوتوماتيكية على مجطتين مختلفتين: أخبار ومحادثات تيد. تم تقييم جميع المقاييس على مدى ارتباطها على مستوى النظام والقطاع مع التصنيفات البشرية. على عكس إصدارات السنوات السابقة، فقد استحوذنا هذا العام على تصنيفاتنا الإنسانية الخاصة بنا على أساس التقييم البشري القائم على الخبراء عبر مقاييس الجودة متعددة الأبعاد (MQM). يحتوي هذا الإعداد على العديد من المزايا: (1) قد أظهر التقييم القائم على الخبراء أنه أكثر موثوقية، (2) تمكنا من تقييم جميع المقاييس على مجاليين مختلفين باستخدام ترجمات نفس أنظمة MT، (III) أضفنا 5 إضافية الترجمات القادمة من نفس النظام أثناء تطوير النظام. بالإضافة إلى ذلك، صممنا ثلاث مجموعات تحدي تقيم متانة جميع المقاييس التلقائية. نقدم تحليلا مكثفا حول مدى أداء المقاييس على أزواج ثلاث لغات: الإنجليزية إلى الألمانية والإنجليزية إلى الروسية والصينية إلى الإنجليزية. نوضح تأثير الترجمات المرجعية المختلفة على المقاييس المستندة إلى المرجع ومقارنة شرح MQM القائم على الخبراء مع درجات DA المكتسبة بواسطة WMT.

metrics shared task metrics shared مقاييس مشتركة المهمة تقاسم المقاييس صناعة حمض الفوسفور

نموذج الطالب التدريس من خلال نتائج التقديم للمهمة المشتركة

513 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

المهام المشتركة لها تاريخ طويل وأصبحت السائدة لأبحاث NLP. تتطلب معظم المهام المشتركة المشاركين تقديم مخرجات وأوصاف النظام فقط. من غير المألوف أن تطلب المهمة المشتركة تقديم النظام نفسه بسبب قضايا الترخيص وفروق التنفيذ. لذلك، يتم التخلي عن العديد من ال أنظمة دون استخدامها في التطبيقات الحقيقية أو المساهمة في أنظمة أفضل. في هذا البحث، نقترح مخططا للاستفادة من كل تلك النظم التي شاركت في المهام المشتركة. نستخدم جميع مخرجات النظام المشارك كمعلمي المهام في هذا المخطط وتطوير نموذج جديد كطالب يهدف إلى تعلم خصائص كل نظام. نسمي هذا التدريس المشترك بين المخطط. "هذا المخطط يخلق نظام موحد يؤدي أفضل من أفضل نظام المهام الموحد. يتطلب فقط مخرجات النظام، والجهد الإضافي قليلا هناك حاجة إلى المشاركين والمنظمين. نحن نطبق هذا المخطط على المهمة المشتركة Shinra2019-JP، التي لديها تسعة مشاركين بدقة مختلفة من الإخراج، مما يؤكد أن النظام الموحد يتفوق على أفضل نظام. علاوة على ذلك، تم إصدار الرمز المستخدم في تجاربنا.

submission results نتائج التقديم صناعة حمض الفوسفور

نتائج المهمة المشتركة WMT على الترجمة الآلية باستخدام المصطلحات

779 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

مجالات اللغة التي تتطلب الاستخدام الدقيق للغاية للمصطلحات وفيرة وتعكس جزءا كبيرا من صناعة الترجمة.في هذا العمل، نقدم معيارا لتقييم نوعية الترجمة المصطلحات والاتساق، مع التركيز على المجال الطبي (والكوفي 19 على وجه التحديد) لمدة خمسة أزواج لغوية: الإنج ليزية إلى الفرنسية والصينية والروسية والكورية، وكذلك جمهورية التشيكألمانية.نبلغ عن أوصاف النظم المشاركة ونتائجها، وتعليقا على الحاجة إلى مزيد من الجهود البحثية فيما يتعلق بتعامل مع المصطلحات الأكثر ملاءمة أيضا نحو صياغة وتقييم مناسبة للمهمة.

wmt shared task wmt shared WMT مشاركتها المهمة شارك WMT. صناعة حمض الفوسفور

المهمة المشتركة Eval4NLP على تقدير الجودة القادم: نظرة عامة

724 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذه الورقة، نقدم المهمة المشتركة ESPR4NLP-2021 على تقدير الجودة القادم.بالنظر إلى زوج ترجمة من المصدر، فإن هذه المهمة المشتركة لا تتطلب فقط توفير درجة على مستوى الجملة تشير إلى الجودة الشاملة للترجمة، ولكن أيضا لشرح هذه النقاط عن طريق تحديد الكلما ت التي تؤثر سلبا على جودة الترجمة.نقدم البيانات وإرشادات التوضيحية وإعداد تقييم المهمة المشتركة، وصف النظم الستة المشاركة وتحليل النتائج.إلى حد ما من معرفتنا، هذه هي المهمة المشتركة الأولى على مقاييس تقييم NLP القابلة للتفسير.تتوفر مجموعات البيانات والنتائج في https://github.com/eval4nlp/sharedtask2021.

explainable quality estimation تقدير الجودة الشرح صناعة حمض الفوسفور

مهمة مشتركة في تقييم الدقة: الاستفادة من التوضيحات السابقة في عملية التحقق من الصحة

824 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم هذا بموجبه تقديمنا إلى المهمة المشتركة في تقييم الدقة في مؤتمر INLG 2021.يعتمد بروتوكول التقييم لدينا على ثلاثة مكونات رئيسية؛القواعد والصفوف النصية المصنفة التي تعلق مسبقا على مجموعة البيانات، وهو عبقري بشري يتحقق من التوضيح المسبق، وواجهة الوي ب التي تسهل هذا التحقق من الصحة.يتكون التقديم لدينا في حقيقة وجود تقريرين؛نحلل أولا فقط أداء القواعد والصفوفات المصنفة (الشرحين قبل التوضيحية)، ثم التقييم البشري يساعده الشروح السابقة السابقة باستخدام واجهة الويب (الهجين).رمز واجهة الويب والصفوف هو متاح علنا.

task in evaluating evaluating accuracy المهمة في تقييم تقييم الدقة صناعة حمض الفوسفور

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2115 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

معھد الشام العالي للعلوم الشرعية واللغة العربية والدراسات والبحوث الإسلامية

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

تحديات الجيل: نتائج تقييم الدقة المهمة المشتركة

Generation Challenges: Results of the Accuracy Evaluation Shared Task

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة