إن فهم وتعليمات اللغة الطبيعية في مجال أساسي هي واحدة من السمات المميزة للذكاء الاصطناعي. في هذه الورقة، نركز على فهم التعليمات في المجال العالمي كتل والتحقيق في قدرات فهم قدرات نظامين أفضل أداء للمهمة. نحن نهدف إلى فهم ما إذا كان أداء اختبار هذه النماذج يشير إلى فهم المجال المكاني وتعليمات اللغة الطبيعية بالنسبة إليها، أو ما إذا كانت مجرد إشارات متفوقة في DataSet. نقوم بصياغة مجموعة من التوقعات قد يكون لدى المرء من التعليمات التالية النموذج وتمييز الأبعاد المختلفة المختلفة التي يجب أن تمتلكها مثل هذا النموذج. على الرغم من أداء الاختبار اللائق، نجد أن النماذج الحديثة تنخفض هذه التوقعات وهشة للغاية. بعد ذلك اقترحنا استراتيجية تعليمية تتضمن تكبير البيانات وإظهارها من خلال تجارب واسعة النطاق التي توليها استراتيجية التعلم المقترحة نماذج تنافسية في مجموعة الاختبار الأصلية مع إرضاء توقعاتنا بشكل أفضل.
Understanding and executing natural language instructions in a grounded domain is one of the hallmarks of artificial intelligence. In this paper, we focus on instruction understanding in the blocks world domain and investigate the language understanding abilities of two top-performing systems for the task. We aim to understand if the test performance of these models indicates an understanding of the spatial domain and of the natural language instructions relative to it, or whether they merely over-fit spurious signals in the dataset. We formulate a set of expectations one might have from an instruction following model and concretely characterize the different dimensions of robustness such a model should possess. Despite decent test performance, we find that state-of-the-art models fall short of these expectations and are extremely brittle. We then propose a learning strategy that involves data augmentation and show through extensive experiments that the proposed learning strategy yields models that are competitive on the original test set while satisfying our expectations much better.
المراجع المستخدمة
https://aclanthology.org/
يتطلب تنفيذ تعليمات اللغة الطبيعية في مجال أساسي جسديا نموذجا يفهم كل من المفاهيم المكانية مثل اليسار من "" وما فوق ""، واللغة التركيبية المستخدمة لتحديد المعالم وتعيين التعليمات المتعلقة بها. في هذه الورقة، ندرس فهم التعليمات في المجال العالمي كتل.
البنية القياسية المستخدمة في التعليمات التالية غالبا ما تكافح على تركيبات رواية من الفئة (E.G. التنقل إلى المعالم أو التقاط الأشياء) لاحظت أثناء التدريب.نقترح هندسة معيارية لاتباع تعليمات اللغة الطبيعية التي تصف تسلسلات فرعية متنوعة.في نهجنا، فروع ال
نقوم بتحليل تغيير اللغة بمرور الوقت في مهمة تعليمية تعاونية وموجهة نحو تحقيق الأهداف، حيث تكثف المرافق تعظيم المشاركين في الاتفاقيات وزيادة خبراتهم.درس العمل المسبق مثل هذه السيناريوهات في الغالب في سياق الألعاب المرجعية، ووجدت باستمرار أن تعقيد اللغ
على الرغم من تطبيق نماذج التسلسل العصبي للتسلسل بنجاح على التحليل الدلالي، إلا أنها تفشل في التعميم التركيبي، أي أنها غير قادرة على التعميم بشكل منهجي لتركيبات غير مرئية من مكونات المشاهدة. بدافع من التحليل الدلالي التقليدي حيث يتم احتساب التركيز بشك
وقد تبين أن الكثير من التقدم الأخير في NLU كان بسبب الاستدلال الخاصة بمواد بيانات التعلم من النماذج.نقوم بإجراء دراسة حالة للتعميم في NLI (من MNLI إلى مجموعة بيانات Hans التي شيدت عدسي) في مجموعة من الهيغات القائمة على Bert (محولات ومحولات سيامي و De