ترغب بنشر مسار تعليمي؟ اضغط هنا

التنوع كمنتج ثانوي: توليد اللغة الموجهة نحو الأهداف يؤدي إلى التباين اللغوي

Diversity as a By-Product: Goal-oriented Language Generation Leads to Linguistic Variation

269   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن القدرة على التباين في استخدام اللغة ضروري للمتحدثين لتحقيق أهدافهم المحادثة، على سبيل المثال عند الإشارة إلى الكائنات في البيئات المرئية.نقول أن التنوع لا ينبغي أن يكون على غرار كهدف مستقل في الحوار، ولكن يجب أن يكون نتيجة لذلك أو منتج ثاني لتوليد اللغة الموجهة نحو الأهداف.تم التحقيق في خطوط عمل مختلفة في توليد اللغة العصبية طرق فك تشفيرها لتوليد المزيد من الكلمات المتنوعة، أو زيادة المعلوماتية من خلال التفكير العملي.نربط تلك خطوط العمل وتحليل كيفية تأثير المنطق العملي أثناء فك التشفير على تنوع التسميات التوضيحية الناتجة عنها.نجد أن تعزيز التنوع نفسه لا يؤدي إلى تسهيلات مفيدة بشكل أكثر عمليا، لكن المنطق العملي يزيد من التنوع المعجمي.أخيرا، نناقش ما إذا كان الاستفادة من المعلوماتية بطرق غير معقولة بمرحلة ما بين اللغوي.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن معرفة البرامج النصية سلاسل الأحداث المشتركة في السيناريوهات النمطية، هي أصول قيمة لأنظمة فهم اللغة الطبيعية الموجهة نحو المهام.نقترح مهمة بناء البرنامج النصي الموجهة نحو الأهداف، حيث ينتج نموذج سلسلة من الخطوات لإنجاز هدف معين.نحن نعارض مهمتنا في أول مجموعة بيانات تعليمية متعددة اللغات متعددة اللغات تدعم 18 لغة تم جمعها من Wikihow، وهو موقع على شبكة الإنترنت يحتوي على نصف مليون حول المقالات.بالنسبة إلى الأساس، نفكر في نهج قائم على الجيل باستخدام نموذج لغة ونهج يستند إلى استرجاعه من خلال استرداد الخطوات ذات الصلة لأول مرة من بركة مرشحة كبيرة ثم طلبها.نظرا لأن مهمتنا عملية، غير ممكنة ولكن صعبة النماذج المحولات الحديثة، وأن طرقنا يمكن نشرها بسهولة لمختلف مجموعات البيانات والمجالات الأخرى مع أداء طلقة صفرية لائقة.
في أنظمة الحوار الموجهة نحو الأهداف، يقدم المستخدمون المعلومات من خلال قيم الفتحة لتحقيق أهداف محددة. عمليا، يمكن أن تكون بعض مجموعات قيم الفتحة غير صالحة وفقا للمعرفة الخارجية. على سبيل المثال، مزيج من بيتزا الجبن "(عنصر القائمة) وملفات تعريف الارتب اط OREO" (تتصدر) من كلام الإدخال يمكن أن أطلب بيتزا جبنة مع ملفات تعريف الارتباط Oreo على القمة؟ "تعويضات مثل هذه المجموعات غير الصالحة وفقا للقائمة من مطعم العمل. تسمح أنظمة الحوار التقليدية بإعدام قواعد التحقق من الصحة كخطوة بعد المعالجة بعد أن تم ملء الفتحات التي يمكن أن تؤدي إلى تراكم الخطأ. في هذه الورقة، نقوم بإضفاء الطابع الرسمي على قيود فتحة مدفوعة بالمعرفة وتقديم مهمة جديدة من اكتشاف انتهاك القيد مصحوبة ببيانات معايير. ثم نقترح طرق لإدماج المعرفة الخارجية في الكشف عن انتهاك الانتهاك في النظام والنموذج كمركز تصنيف نهاية إلى نهج ومقارنته لنهج خط أنابيب القواعد التقليدي. تجرب التجارب على مجاليين من مجموعة بيانات متعددة الأوجه من تحديات الكشف عن انتهاك القيود وتضع المرحلة للعمل في المستقبل والتحسينات.
مع الاستخدام المتزايد لأحكام الخوارزميات المدفوعة بالجهاز، من الأهمية بمكان تطوير النماذج القوية في المدخلات المتطورة أو التلاعب بها.نقترح تحليلا واسع النطاق من المتانة النموذجي ضد التباين اللغوي في تحديد الكشف الأخبار الخادع، وهي مهمة مهمة في سياق ا لمعلومات الخاطئة المنتشرة عبر الإنترنت.نحن نفكر في مهام التنبؤ ومقارنة ثلاثة من المدينات الحديثة لتسليط الضوء على الاتجاهات المتسقة في الأداء النموذجي، وتظليل الثقة العالي، والإخفاقات عالية التأثير.من خلال قياس فعالية استراتيجيات الدفاع المشددي وتقييم الحساسية النموذجية للهجمات الخصومة باستخدام نص غير مضطرب للشخصية، نجد أن الطابع أو النماذج المختلطة هي الدفاعات الأكثر فعالية وأن تكتيكات الهجوم القائم على الاضطرابات الأكثر نجاحا.
تقدم هذه الورقة طريقة تلقائية لتقييم طبيعية توليد اللغة الطبيعية في أنظمة الحوار.في حين تم تقديم هذه المهمة من خلال العمل البشري باهظ الثمن وتستغرق وقتا طويلا، فإننا نقدم هذه المهمة الرواية التابعة لتقييم الطاقة التلقائي للغة الناتجة.من خلال ضبط نموذ ج Bert، تظهر طريقة تقييم الطبيعية المقترحة لدينا نتائج قوية وتتفوق على الأساس: آلات Vector Support، LSTMS ثنائي الاتجاه، ونفرت.بالإضافة إلى ذلك، يتم تحسين أداء سرعة التدريب وتقييم نموذج طبيعي من خلال نقل التعلم من المعرفة اللغوية بالجودة والمعلوماتية.
لكل مهمة حوار موجهة نحو تحقيق الأهداف ذات أهمية، يجب جمع كميات كبيرة من البيانات للحصول على التعلم المنتهي للنظام الحوار العصبي.جمع هذه البيانات هي عملية مكلفة وتستغرق وقتا طويلا.بدلا من ذلك، نوضح أنه يمكننا استخدام كمية صغيرة فقط من البيانات، والتي تستكمل البيانات من مهمة حوار ذات صلة.فشل التعلم بسذاجة من البيانات ذات الصلة في تحسين الأداء لأن البيانات ذات الصلة يمكن أن تكون غير متسقة مع المهمة المستهدفة.نحن نصف طريقة تعتمد على التعلم التعريفي والتي تتعلم بشكل انتقائي من بيانات مهمة الحوار ذات الصلة.نهجنا يؤدي إلى تحسينات بدقة كبيرة في مهمة الحوار مثال.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا