يتماشى التواصل بين الوكلاء البشري والهاتف المحمول بشكل متزايد حيث يتم نشر هذه الوكلاء على نطاق واسع في حياتنا اليومية. الرؤية والحوار الملاحة هي واحدة من المهام التي تقوم بتقييم قدرة الوكيل على التفاعل مع البشر للحصول على المساعدة والتنقل على أساس ردود اللغة الطبيعية. في هذه الورقة، نستكشف الملاحة من مهمة تاريخ الحوار (NDH)، والتي تستند إلى مجموعة بيانات الملاحة في الرؤية والحوار التعاوني (CVDN)، وتقديم نموذج أحدث من الفن الذي تم بناؤه عند الرؤية محولات اللغة. ومع ذلك، على الرغم من تحقيق الأداء التنافسي، نجد أن الوكيل في مهمة NDH لم يتم تقييمه بشكل مناسب من خلال التقدم المتقدي الرئيسي - الهدف. من خلال تحليل عدم تطابق الأداء بين تقدم المرمى ومقاييس أخرى (على سبيل المثال، تزييف الوقت الديناميكي الطبيعي) من نموذج الحديث لدينا، نوضح أن إعداد المهام المستندة إلى المسار الفرعي NDH (أي، التنقل إلى مسار جزئي بناء على مراسله لا توفر مجموعة فرعية من الحوار الكامل الوكيل مع إشارة إشراف كافية نحو منطقة الهدف. لذلك، نقترح إعداد مهمة جديدة يسمى NDH - الكامل الذي يأخذ الحوار الكامل ومسار التنقل بأكمله كحل واحد. نقدم نموذجا أساسيا قويا وإظهار النتائج الأولية في هذه المهمة الجديدة. وصفنا كذلك العديد من الأساليب التي نحاولها، من أجل تحسين الأداء النموذجي (بناء على تعلم المناهج الدراسية، ما قبل التدريب، وتعزيز البيانات)، مما يشير إلى طرق تدريب مفيدة محتملة في هذه المهمة الجديدة NDH الجديدة.