ترغب بنشر مسار تعليمي؟ اضغط هنا

يتقيد: تصنيف العالم المفتوح عبر المثيلات التي تحولت تدريجيا

ODIST: Open World Classification via Distributionally Shifted Instances

168   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذا العمل، نتعلم مشكلة تصنيف العالم المفتوح مع طريقة تسمى الدعاء، وفتح التصنيف العالمي عبر المثيلات التي تحولت بشكل تدريجي.هذه الطريقة الرواية والمساومة يمكن أن تنشئ مثيلات خارج المجال من مثيلات التدريب داخل المجال بمساعدة نموذج لغة تابعة مدرب مسبقا.تظهر النتائج التجريبية أن التصديح يؤدي إلى أفضل من طريقة العثور على قرارات القرار الحديثة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم مجموعة بيانات جديدة لإعادة كتابة الأسئلة في سياق المحادثة (QRECC)، والتي تحتوي على محادثات 14 ألف مع أزواج من الإجابات السؤال 80k.تتمثل المهمة في QRECC في العثور على إجابات على أسئلة المحادثة داخل مجموعة من صفحات الويب 10 أمتار (تقسيم إلى 54 متر ا مربعا).قد يتم توزيع إجابات على الأسئلة الموجودة في نفس المحادثة عبر العديد من صفحات الويب.توفر QRECC التعليقات التوضيحية التي تسمح لنا بتدريب وتقييم المهارات الفرعية الفردية من إعادة كتابة السؤال، واسترجاع المرور وفهم القراءة المطلوبة لمهمة الإجابة على مسألة المحادثة نهاية إلى نهاية.نبلغ عن فعالية نهج خط الأساس القوي الذي يجمع بين النموذج الحديثة لإعادة كتابة الأسئلة والنماذج التنافسية لقضاء ضمان الجودة المفتوحة.حددت نتائجنا أول خط أساسي ل DataSet QRECC مع F1 من 19.10، مقارنة بمضابط العلوي البشري 75.45، مما يدل على صعوبة الإعداد وغرفة كبيرة للتحسين.
يتم وضع تقدير الجودة على مستوى الجملة (QE) من الترجمة الآلية بشكل تقليدي كملقمة الانحدار، ويتم قياس أداء نماذج QE عادة بواسطة ارتباط بيرسون مع ملصقات بشرية. حققت نماذج QE الأخيرة مستويات ارتباطا غير مرئي مسبقا بأحكام بشرية، لكنها تعتمد على نماذج لغوي ة محلية متعددة اللغات الكبيرة باهظة الثمن بشكل حسابي وجعلها غير ممكنة لتطبيقات العالم الحقيقي. في هذا العمل، نقوم بتقييم العديد من تقنيات ضغط النماذج ل QE والعثور على ذلك، على الرغم من شعبيتها في مهام NLP الأخرى، فإنها تؤدي إلى ضعف الأداء في وضع الانحدار هذا. نلاحظ أن هناك حاجة إلى معلمة نموذجية كاملة لتحقيق نتائج SOTA في مهمة الانحدار. ومع ذلك، فإننا نجادل بأن مستوى التعبير عن نموذج في مجموعة مستمرة غير ضرورية لإحضار تطبيقات المصب في QE، وإظهار أن إعادة صياغة QE كمشكلة تصنيف وتقييم نماذج QE باستخدام مقاييس التصنيف من شأنها أن تعكس أدائها الفعلي بشكل أفضل في الواقع تطبيقات العالم.
من المفترض أن يتحدث Chatbots المجال المفتوح بحرية مع البشر دون أن يقتصر على موضوع أو مهمة أو مجال. ومع ذلك، فإن حدود و / أو محتويات المحادثات المفتوحة ليست واضحة. لتوضيح حدود الانفتاح "، نقوم بإجراء دراستين: أولا، نقوم بتصنيف أنواع أحداث الكلام" واجه تها في مجموعة بيانات تقييم ChatBot (أي مينا من Google) وتجد أن هذه المحادثات تغطي بشكل أساسي الكلام الصغير بشكل أساسي "الفئة واستبعاد وفئات أحداث الكلام الأخرى التي تواجهها في الحياة البشرية الحقيقية البشرية. ثانيا، نقوم بإجراء دراسة تجريبية صغيرة على نطاق واسع لتوليد محادثات عبر الإنترنت تغطي مجموعة واسعة من فئات أحداث الكلام بين إطارين مقابل رجل بشري وحديث من شاتبوت (I.E.، خلاط على Facebook). يشير التقييم البشري لهذه المحادثات الناتجة إلى تفضيل للمحادثات البشرية، لأن محادثات الإنسان التي تشاتبوت تفتقر إلى التماسك في معظم فئات أحداث الكلام. بناء على هذه النتائج، نقترح (أ) استخدام مصطلح الحديث الصغير "بدلا من المجال المفتوح" للاتحاد الحالي الذي لا يفتح "من حيث قدرات المحادثة بعد، و (ب) مراجعة أساليب التقييم لاختبار محادثات Chatbot ضد أحداث الكلام الأخرى.
تقدم التطورات الحديثة في QA في الهواء الطلق إلى نماذج قوية تعتمد على استرجاع كثيف، ولكن ركزت فقط على استرداد المقاطع النصية.في هذا العمل، نتعامل مع QA المجال المفتوح على الجداول لأول مرة، وإظهار أنه يمكن تحسين الاسترجاع من خلال المسترد المصمم للتعامل مع سياق الجدول.نقدم إجراءات فعالة مسبقة التدريب لاستردادنا وتحسين جودة الاسترجاع مع السلبيات الصلبة الملغومة.نظرا لأن مجموعات البيانات ذات الصلة مفقودة، فإننا نستخلص مجموعة فرعية من الأسئلة الطبيعية (Kwiatkowski et al.، 2019) في مجموعة بيانات QA.نجد أن المسترد الخاص بنا يحسن نتائج الاسترجاع من 72.0 إلى 81.1 استدعاء @ 10 وتنفذ QA نهاية إلى نهاية من 33.8 إلى 37.7 مباراة دقيقة، عبر المسترد القائم على بيرت.
منذ فترة طويلة تم الاعتراف بأن اللاحقة أكثر شيوعا من البادئة بلغات العالم. هناك حاجة إلى إحصاءات أكثر تفصيلا حول هذا الاتجاه لشحذ التفسيرات المقترحة لهذا الاتجاه. والنهج الكلاسيكي لجمع البيانات حول تفضيل البادئة / لاحقة هو الإنسان لقراءة الأوصاف النح وية (948 لغة)، وهي تستغرق وقتا طويلا وتتضمن أحكاما تقديرا. في هذه الورقة، نستكشف مناهجا مدفوعة بالآتصاد لإحصائيات البادئة واللاحقة التي هي تقريبية من النفط الخام، ولكن لديها مزايا من حيث الوقت وتكرارها. يبحث أولا ببساطة مجموعة كبيرة من الأوصاف النحوية للحوادث المتعلقة بادئة المصطلحات واللاحقة "(4 287 لغة). ثاني تحسب السلاحيات من بيانات النص الخام بطريقة تعكس بشكل غير مباشر البقرات واللقب (1 030 لغة، باستخدام ترجمات العهد الجديد). تتفق الأساليب الثلاثة إلى حد كبير في قياساتها ولكن هناك اختلافات نظرية وعملية مهمة. في جميع القياسات، هناك تفضيلات شاملة للإقصاء، وإن كان ذلك فقط قليلا، على نسب تتراوح بين 0.51 و 0.68.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا