ترغب بنشر مسار تعليمي؟ اضغط هنا

عرض من الحشد: تحديات التقييم لتطبيقات تفاعل الزمن

A View From the Crowd: Evaluation Challenges for Time-Offset Interaction Applications

342   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

اكتسبت أنظمة الحوار مثل Chatbots، والمهام مثل الإجابة على الأسئلة (QA) الجر في السنوات الأخيرة؛ بعد تقييم هذه الأنظمة لا تزال صعبة. وتشمل الأسباب مجموعة متنوعة كبيرة في السياقات واستخدام حالات هذه الأنظمة وكذلك التكلفة العالية للتقييم البشري. في هذه الورقة، نركز على نوع معين من أنظمة الحوار: تطبيقات تفاعل إزاحة الوقت (TOIAIA) ذكي، برامج محادثة محاكمة محادثات وجها لوجه بين البشر والحجيجات الإنسانية المسجلة مسبقا. ضمن القيد أن تویا هو نظام إخراج واحد يتفاعل مع المستخدمين مع توقعات مختلفة، نحدد تحديين: أولا، كيف نحدد إجابة جيدة؟ والثاني، ما هو متري مناسب لاستخدامها؟ نستكشف التحديات من خلال إنشاء مجموعة بيانات جديدة تحدد إجابات جيدة متعددة على أسئلة تویا محددة من خلال مساعدة عمال الأمازون الميكانيكية التركيون. يتيح لنا هذه الرأي من الحشد دراسة الاختلافات في كيفية إدراك المحققين الذين يتويا إجاباتها. تشمل مساهماتنا مجموعة البيانات المشروحة التي نجعلها متاحة للجمهور واقتراح معدل النجاح الخاص بك كتقسيط تقييم أكثر ملاءمة من مقاييس استرجاع الجودة التقليدية واسترجاع المعلومات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تسمح تطبيقات التفاعل في إزاحة الوقت (TOIA) بمحاكاة المحادثات مع الأشخاص الذين سجلوا كلمات الفيديو ذات الصلة مسبقا، والتي يتم لعبها استجابة لمستخدمها التفاعل.لدى Toias إمكانات كبيرة للحفاظ على التواريخ عبر الأجيال والثقافية، والتدريس عبر الإنترنت، وال مقابلات المحاكاة، وما إلى ذلك. توجد Toias الحالية في السياقات المتخصصة التي تنطوي على تكاليف إنتاج عالية.تقدم الديمقراطية TOIA تحديات مختلفة عند إنشاء التسجيلات السابقة المناسبة، وتصميم قصص مستخدم مختلفة، وإنشاء واجهات بسيطة عبر الإنترنت للتجريب.نقوم بفتح المصدر TOIA 2.0، وهو تطبيق تفاعل متوفع للوقت الذي تركز على المستخدم، وجعله متاحا لكل من يريد التفاعل مع التسجيلات السابقة للأشخاص، أو إنشاء تسجيلات مسبقة الدفع.
تُصنف الخدمات التي يطلبها المستخدمون عبر شبكة الانترنت إلى نوعين أساسيين، خدمات تعمل بالزمن الحقيقي مثل تطبيقات الفيديو و الصوت بالزمن الحقيقي و هي تستخدم بروتوكول (UDP (Unit Datagram Protocol، و خدمات أخرى تعمل بالزمن غير الحقيقي مثل تطبيقات تصفح ال ويب (HTTP (Hiyber Text Transfer Protocol و نقل الملفات FTP) File Transfer Protocol) و تستخدم بروتوكول TCP( Transmission Control Protocol). يتم في هذا البحث دراسة و تحليل الخوارزميات التي تحسن جودة الخدمة لمختلف هذه التطبيقات، فمن أجل تطبيقات الزمن الحقيقي يتم استخدام قواعد الرتل التي تعطي أفضلية لهذه الخدمات و تحقق أقل تأخير زمني، أما من أجل تطبيقات الزمني غير الحقيقي فيتم دراسة خوارزميات التحكم بالازدحام التي تحقق أفضل أداء لعملية النقل الموثوق بوجود الازدحام عبر شبكة الانترنت. تم استخدام برنامج المحاكاة Opnet 14.5 لمحاكاة الخدمات المختلفة عبر شبكة الانترنت، و تبين نتائج الدراسة الحصول على أقل تأخير زمني لخدمة الصوت، و تحقيق معدل إرسال عالي لتطبيق FTP بوجود ضياع للرزم في الشبكة.
تركز المهمة المشتركة على تقييم الدقة على التقنيات (كلا اليدين والآلية) لتقييم الدقة الواقعية للنصوص التي تنتجها أنظمة NLG العصبية، في مجال التقارير الرياضية.قدم أربعة فرق تقنيات التقييم لهذه المهمة، باستخدام نهج وتقنيات مختلفة للغاية.طلبت التقديمات ا لأفضل أداء جيدا في هذه المهمة الصعبة.ومع ذلك، تكافح جميع التقديمات التلقائية للكشف عن الأخطاء الواقعية المعقدة دلالة أو بشكل غير رسمي (على سبيل المثال، بناء على حساب أو استنتاج غير صحيح).
هذا البحث يقدم طريقة جديدة لتقليل زمن تنفيذ برامج المعالجة, عن طريق اختصار حجم المعلومات المعالجة و لاسيما في التطبيقات التي تكون الأولوية فيها لسرعة المعالجة على المعلومات التقصيلية للصور, كأنظمة الكشف و الملاحقة.
تم استخدام Growdsourcing بشكل مجيئي لتعليق مجموعات هائلة من البيانات.ومع ذلك، فإن العقبات الرئيسية التي تحول دون استخدام ملصقات من مصادر الحموشة هي ضوضاء وأخطاء من التعليقات الشرحية غير الخبراء.في هذا العمل، يقترح مقارنتين تتعامل مع الضوضاء والأخطاء في ملصقات الحشد.يستخدم النهج الأول تقليل الحد الأدنى على علم الحدة (SAM)، وهي تقنية التحسين بقوة بالملصقات الصاخبة.ينفد النهج الآخر على أن طبقة شبكة عصبية تدعى SoftMax-Crowdlayer مصممة خصيصا للتعلم من التعليقات التوضيحية من الحشد.وفقا للنتائج، يمكن للنهج المقترحة تحسين أداء نموذج الشبكة المتبقية الواسعة ونموذج التصور متعدد الطبقات المطبقة على مجموعات بيانات المصادر في الحشد في مجال معالجة الصور.كما أنه يحتوي على نتائج مماثلة ومقارنة مع تقنية التصويت الأغلبية عند تطبيقها على مجال البيانات المتسلسل حيث يتم استخدام تمثيلات التشفير الثنائية من المحولات (Bert) كطراز أساسي في كلا الحالتين.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا