ترغب بنشر مسار تعليمي؟ اضغط هنا

Cortcutted Commonsense: Data Sprications في التعلم العميق من التفكير المنطقي

Shortcutted Commonsense: Data Spuriousness in Deep Learning of Commonsense Reasoning

384   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المنطقية هي القدرة البشرية المثالية التي كانت تحديا أساسيا للذكاء الاصطناعي منذ إنشائها. النتائج المثيرة للإعجاب في مهام معالجة اللغة الطبيعية، بما في ذلك في مجال المنطقي، قد تحققت باستمرار مع نماذج اللغة العصبية المحولات، حتى مطابقة أو تجاوز الأداء البشري في بعض المعايير. في الآونة الأخيرة، تم استدعاء بعض هذه التقدم سؤالا: لذلك ما يسمى بتحف البيانات في البيانات التدريبية واضحة مثل الارتباطات الزائفة والاختصارات الضحلة التي تستفيد في بعض النتائج هذه النتائج المتميزة. في هذه الورقة نسعى إلى مزيد من متابعة هذا التحليل في عالم مهام معالجة اللغة ذات الصلة بالعموم. نحن نقوم بدراسة عن مختلف المعايير البارزة التي تنطوي على التفكير في المنطقية، على طول عدد من تجارب الإجهاد الرئيسية، وبالتالي تسعى للحصول على نظرة ثاقبة حول ما إذا كانت النماذج تتعلم التعميمات القابلة للتحويل جوهرية للمشكلة الموجودة على المحك أو الاستفادة من الاختصارات العرضية في البيانات العناصر. تشير النتائج التي تم الحصول عليها إلى أن معظم مجموعات البيانات جربت إشكالية، مع اللجوء من النماذج إلى ميزات غير قوية ويبدو أن لا تتعلم وتعميم تجاه المهام الشاملة التي تهدف إلى نقلها أو تكتسبها مجموعات البيانات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يركز البحث في مجال المنطق الحالي على تطوير النماذج التي تستخدم معرفة المنطقية للإجابة على أسئلة متعددة الخيارات. ومع ذلك، قد لا تكون النظم المصممة للإجابة على أسئلة متعددة الخيارات مفيدة في التطبيقات التي لا توفر قائمة صغيرة من إجابات المرشحين للاختي ار من بينها. كخطوة نحو جعل البحث منطق المنطقي أكثر واقعية، نقترح دراسة مسطحة المنطقية المفتوحة العضوية (OPENCSR) --- مهمة الإجابة على سؤال المنطقي دون أي اختيارات محددة مسبقا --- استخدام كموارد فقط حقائق المنطقية مكتوبة باللغة الطبيعية. OpenCSR تحديا بسبب مساحة قرارات كبيرة، ولأن العديد من الأسئلة تتطلب منطق متعدد القفز الضمني. كنعجا من OpenCSR، نقترح نماذج شديدة الفضلة للمناسبة متعددة القفز بشأن حقائق المعرفة. لتقييم أساليب OpenCSR، نقوم بتكييف العديد من معايير المنطق المنطقية الشائعة، وجمع إجابات جديدة متعددة لكل سؤال اختبار عبر مصادر الحشد. تظهر التجارب أن DrFact تفوق أساليب أساسية قوية من قبل هامش كبير.
أدت نماذج اللغة المدربة مسبقا إلى مكاسب كبيرة على مجموعة واسعة من مهام معالجة اللغة الطبيعية (NLP)، ولكنها تبين أن قيود لمهام توليد اللغة الطبيعية مع متطلبات عالية الجودة على الإخراج، مثل جيل العمولة والإعلان توليد الكلمات الرئيسية. في هذا العمل، نقد م تصفية المعرفة الرواية وشبكة تعليمية مرافقة (KFCNET) التي تشير إلى معرفة خارجية وتحقق أداء أفضل من الجيل. على وجه التحديد، نقترح نموذج مرشح يستند إلى BERT لإزالة المرشحين ذوي الجودة المنخفضة، وتطبيق التعلم المقاوم للتناقض بشكل منفصل لكل من التشفير والكشف، داخل بنية فك التشفير العامة - فك التشفير. تساعد الوحدة النمطية للتناقض في التشفير على التقاط دلالات استهداف عالمية أثناء الترميز، وتعزز وحدة فك ترميز وحدة فك الترميز فائدة النماذج الأولية المستردة أثناء تعلم الملامح العامة. تجارب واسعة النطاق في معيار Commongen تشير إلى أن نموذجنا يتفوق على الحالة السابقة للفنية من قبل هامش كبير: +6.6 نقطة (42.5 مقابل 35.9) ل BLU-4، +3.7 نقطة (33.3 مقابل 29.6) للتوابل، و + 1.3 نقطة (18.3 مقابل 17.0) من أجل عصير التفاح. نتحقق مزيدا من فعالية الوحدة النمطية المقنعة المقترحة على توليد الكلمات الرئيسية للإعلان، وإظهار أن نموذجنا له قيمة تجارية محتملة.
منطق العموم الزمني هي مهمة صعبة لأنها تتطلب المعرفة الزمنية عادة غير صريحة في النص.في هذا العمل، نقترح نموذج فرقة لسبب المنظمات الزمنية.يعتمد نموذجنا على تمثيلات سياقية مدربة مسبقا من نماذج اللغة القائمة على المحولات (IE، Bert)، وعلى مجموعة متنوعة من طرق التدريب لتعزيز تعميم النموذج: 1) ضبط غرامة متعددة الخطوات باستخدام المهام العاطفية المحددة بعناية ومجموعات البيانات، و2) مهمة نموذجية مصممة مصممة خصيصا له مهمة تهدف إلى التقاط معرفة العمليات الزمنية.يتفوق نموذجنا إلى حد كبير على نهج ضبط الدقيقة القياسية والقواعد الأساسية القوية على DataSet MC-Taco.
إن استنتاج المنطقي لفهم وشرح اللغة البشرية هي مشكلة بحثية أساسية في معالجة اللغة الطبيعية. يطرح المشرف على المحادثات الإنسانية تحديا كبيرا لأنه يتطلب التفاهم السياقي والتخطيط والاستدلال والعديد من جوانب المنطق بما في ذلك التفكير السببية والزمان والعم وم. في هذا العمل، نقدم عصير التفاح - مجموعة بيانات مفيدة يدويا تحتوي على تفسيرات حوار دولي في شكل ثلاثة توائم في ثلاثة أضعاف تستنتج المعرفة الصريحة باستخدام استنتاج المناشد السياقي. يمكن أن يؤدي استخراج التفسيرات الغنية من المحادثات إلى تحسين العديد من التطبيقات المصب. يتم تصنيف ثلاثة توائم مشروح حسب نوع المعرفة المنطقية الحالية (على سبيل المثال، السببية، الشرطية، الزمنية). لقد أنشأنا ثلاث مهام مختلفة مكيفة على مجموعة البيانات المشروحة: الاستدلال اللغوي الطبيعي على مستوى الحوار، واستخراج تمتد، واختيار سبان متعدد الخيارات. النتائج الأساسية التي تم الحصول عليها مع النماذج القائمة على المحولات تكشف أن المهام صعبة، مما يمهد الطريق للبحث في المستقبل الواعدة. تتوفر DataSet وتطبيقات الأساس علنا ​​في https://github.com/declare-lab/cider.
أظهرت الأساليب الحديثة بناء على نماذج اللغة المدربين مسبقا أداء مشغل قوي على المنطق المنطقي.ومع ذلك، فإنها تعتمد على شروح بيانات باهظة الثمن والتدريب المستهلكة للوقت.وهكذا، نحن نركز على التفكير المنطقي غير المنشأ.نظهر فعالية استخدام إطار عمل مشترك، ا ستنتاج اللغة الطبيعية (NLI)، لحل مهام المنطق المنطقي متنوعة.من خلال الاستفادة من نقل التحويلات من مجموعات بيانات NLI الكبيرة، وحقن المعرفة الحاسمة من مصادر المنطقية مثل 2020 والفهول الذرية، حققت طريقنا أداء غير مدهز للحالة غير المدرجة في مهمتين منطقتي المنطقية: Winowhy و Commonsenseqa.أظهر إجراء مزيد من التحليل فوائد فئات متعددة من المعرفة، ولكن مشاكل حول الكميات والمتضادات لا تزال تحديا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا