مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

أداء التحقق من الصحة المتوقع وتقدير الحد الأقصى للمتغير العشوائي

Expected Validation Performance and Estimation of a Random Variable's Maximum

572 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

غالبا ما يتم دعم الأبحاث في NLP من خلال النتائج التجريبية، وقد يؤدي الإبلاغ المحسن لهذه النتائج إلى فهم أفضل وأكثر استنساخا. في هذه الورقة، نحلل ثلاثة مقدرين إحصائي لأداء التحقق من الصحة المتوقع، وهي أداة تستخدم لأداء الإبلاغ (على سبيل المثال، الدقة) كدالة للميزانية الحاسوبية (على سبيل المثال، عدد تجارب ضبط HyperParameter). عندما يقوم العمل السابق بتحليل مثل هذه المقدرين يركز على التحيز، فإننا ندرس أيضا التباين ويعني الخطأ التربيعي (MSE). في كل من السيناريوهات الاصطناعية والواقعية، نقوم بتقييم ثلاثة مقدرين والعثور على مقدر غير متحيز لديه أعلى التباين، ومقدر أصغر البتان لديه أكبر تحيز؛ يقيم أصغر MSE يضرب توازن بين التحيز والتباين، وعرض مفاضلة الكلاسيكية من تباين التحيز. نحن نستخدم أداء التحقق من الصحة المتوقع للمقارنة بين النماذج المختلفة، وتحليل مدى متكرر كل مقدر يؤدي إلى رسم استنتاجات غير صحيحة حول أي نماذج تؤدي إلى الأفضل. نجد أن المقدرين المتحيزين تؤدي إلى أقل استنتاجات غير صحيحة، تلمحون بأهمية التقليل من التباين و MSE.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

386 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم هذا بموجبه تقديمنا إلى المهمة المشتركة في تقييم الدقة في مؤتمر INLG 2021.يعتمد بروتوكول التقييم لدينا على ثلاثة مكونات رئيسية؛القواعد والصفوف النصية المصنفة التي تعلق مسبقا على مجموعة البيانات، وهو عبقري بشري يتحقق من التوضيح المسبق، وواجهة الوي ب التي تسهل هذا التحقق من الصحة.يتكون التقديم لدينا في حقيقة وجود تقريرين؛نحلل أولا فقط أداء القواعد والصفوفات المصنفة (الشرحين قبل التوضيحية)، ثم التقييم البشري يساعده الشروح السابقة السابقة باستخدام واجهة الويب (الهجين).رمز واجهة الويب والصفوف هو متاح علنا.

task in evaluating evaluating accuracy المهمة في تقييم تقييم الدقة صناعة حمض الفوسفور

دراسة أداء و فعالية ترميز الشبكة الخطي العشوائي في تحقيق النقل الموثوق للبيانات في الشبكات اللاسلكية ذات الضياع

1700 - جامعة تشرين 2017 ورقة بحثية

تعاني الشبكات اللاسلكية من الضياع المتكرر للرزم لأسباب عديدة منها التداخلات و التصادم و الخفوت، مما يجعل من الوسط اللاسلكي وسط غير موثوق لنقل البيانات. أبرز طرق ضمان وثوقية النقل عبر هذا الوسط هي باستخدام بروتوكول التحكم بالنقل (TCP) و بروتوكول إعادة الطلب التلقائي (ARQ). مؤخراً وجد ترميز الشبكة كتقنية جديدة تغير من طريقة التوجيه التقليدية (خزن-وَ-وجه) في الشبكات إلى طريقة أكثر ذكاءً و فعالية هي (رمز –وَ-وجه)، مما يسهم في زيادة سعة و إنتاجية النقل لهذه الشبكات. تم في هذا البحث استخدام ترميز الشبكة الخطي العشوائي كتقنية واعدة تهدف إلى تحقيق النقل الموثوق للبيانات في الشبكات اللاسلكية ذات الضياع، و كذلك دراسة التحسين الذي تقدمه لأداء هذه الشبكات بحالتي الإرسال الوحيد و المتعدد. لتقييم فعالية هذه التقنية و مقارنة أدائها مع أداء بروتوكولات النقل الموثوق تم استخدام محاكي الشبكات NS3. و قد بينت نتائج المحاكاة تحقيق ترميز الشبكة الخطي العشوائي عملية النقل الموثوق للبيانات بإنتاجية أكبر و تأخير زمني و عدد عمليات إرسال أقل مقارنة بالبروتوكولين (TCP، ARQ).

reliability الوثوقية ترميز الشبكة الخطي العشوائي Random linear network coding TCP بروتوكول التحكم بالإرسال الشبكات اللاسلكية بروتكول إعادة الطلب التلقائي Wireless networks ARQ المزيد..

استخدام مجموعات الخصائص المتعددة لرفع أداء أنظمة التحقق من صحة التواقيع

1274 - جامعة دمشق 2010 ورقة بحثية

لعقود من الزمن، اعتمدت البحوث المنشورة في مجال التحقق الآلي من صحة التواقيع على استخدام مجموعة خصائص واحدة. اختار بعض الباحثين مجموعة الخصائص هذه اعتماداً على خبرتهم في هذا المجال، و اختارها آخرون اعتماداً على خوارزميات انتقاء الخصائص التي تستطيع اخت يار أفضل مجموعة خصائص. في الأنظمة العملية، يمكن أن تحتوي وثائق التواقيع ضجيجاً، و يمكن أن يكون تعرف كاتب الشيك مطلوباً في الحسابات التي يوقع شيكاتها أكثر من شخص. و نظراً إلى انخفاض مستوى أداء النظام الناتج عن مثل هذه المتطلبات، يصبح تحسين أداء نظام التحقق من صحة التواقيع ضرورة. تعرض ورقة البحث هذه تقنية جديدة لاتخاذ القرار بالاعتماد على عدة مجموعات خصائص بدلاً من واحدة فقط. و قد أظهرت النتائج التجريبية أن التقنية الجديدة تعطي تحسيناً مهماً في القدرة على كشف التزوير، و في الأداء العام للنظام.

مجموعات الخصائص المتعددة رفع أداء أنظمة التحقق من صحة التواقيع أنظمة التحقق من صحة التواقيع Multi-Sets of Features improve the Performance of Automatic Signature Verification Systems Automatic Signature Verification Systems

التحقق من البيانات NLI: تقييم تأثير تلف البيانات على أداء النموذج

409 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تمنح نماذج اللغة العصبية المدربة مسبقا أداء عال في مهام الاستدلال اللغوي (NLI).ولكن ما إذا كانوا يفهمون فعلا معنى التسلسلات المصنعة لا يزال غير واضح.نقترح جناح اختبار التشخيص الجديد الذي يسمح بتقييم ما إذا كانت مجموعة البيانات تشكل اختبارا جيدا لتقيي م النماذج معنى فهم القدرات.نحن على وجه التحديد تطبيق تحويلات الفساد التي تسيطر عليها إلى المعايير المستخدمة على نطاق واسع (MNLI و Anli)، والتي تنطوي على إزالة فئات الكلمات بأكملها وغالبا ما تؤدي إلى أزواج الجملة غير الحسية.إذا ظلت دقة النموذجية على البيانات التالفة مرتفعة، فمن المحتمل أن تحتوي مجموعة البيانات على تحيزات إحصائية ومصنوعات تصريفات توقع التنبؤ.عكسيا، يشير انخفاض كبير في الدقة النموذجية إلى أن مجموعة البيانات الأصلية توفر تحديا صحيحا لقدرات منطق النماذج.وبالتالي، يمكن أن تكون عناصر التحكم المقترحة لدينا بمثابة اختبار تحطم لتطوير بيانات عالية الجودة لمهام NLI.

data sanity check sanity check assessing the effect التحقق من البيانات الاختيار التعقل تقييم تأثير صناعة حمض الفوسفور المزيد..

تبسيط التعليقات التوضيحية بين التقاطعات في تطبيع التطبلق الوقت: استكشاف التحقق من صحة النحوية والدل

657 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أثناء النظر في الأوقات الطبيعية في وثائق الأمن الغذائي، وجدنا أن التعليق التوضيحي التركيبي للتوسع في الوقت نفسه يتطلب العديد من التعليقات التوضيحية شبه المكررة للحصول على الدلالات الصحيحة للتعبيرات مثل 7 نوفمبر إلى 11 2021. للحد من هذه المشكلة، نحناس تكشاف استبدال الممتلكات الفاصل الفرعية للخضار بممتلكات فاصلة فاصلة فاخرة، وهذا هو، مما يجعل أصغر الوحدات (على سبيل المثال، 7 و 11 عاما بدلا من أكبر الوحدات (على سبيل المثال، 2021) رؤساء سلاسل التقاطع.لضمان ظل دلالات الفواصل الزمنية المشروحة دون تغيير على الرغم من تغييراتنا في بناء جملة مخطط التوضيحية، طبقنا العديد من التقنيات المختلفة للتحقق من صحة تغييراتنا.تم اكتشاف تقنيات التحقق من الصحة هذه وسمحتنا بحل العديد من الأخطاء المهمة في الترجمة الآلية لدينا من الفاصل الفرعي إلى بناء جملة فائق الفاصل الزمني.

exploring syntactic time normalization annotation time normalization استكشاف النحوية تطبيع الوقت التطبلق تطبيع الوقت صناعة حمض الفوسفور المزيد..

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

1441 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة دمشق

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

أداء التحقق من الصحة المتوقع وتقدير الحد الأقصى للمتغير العشوائي

Expected Validation Performance and Estimation of a Random Variable's Maximum

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة