ترغب بنشر مسار تعليمي؟ اضغط هنا

معايرة المستمعين الخاص بك!التدريب القائم على الاتصالات القوية للمتحدثين العمليين

Calibrate your listeners! Robust communication-based training for pragmatic speakers

188   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أن تكون شركاء محادثة جيدة، يجب تدريب أنظمة معالجة اللغة الطبيعية (NLP) على إنتاج كلمات مفيدة بشكل سياق. حقق العمل المسبق في تدريب أنظمة NLP بالأهداف القائمة على الاتصالات، حيث يقف المستمع العصبي كشريك اتصال. ومع ذلك، فإن هذه الأنظمة تعاني عادة من الانجراف الدلالي حيث تتلاشى اللغة المستفادة جذريا من اللغة الطبيعية. نقترح طريقة تستخدم سكان المستمعين العصبيين لتنظيم تدريب المتكلم. نوضح أولا أن الانجراف اللغة ينشأ من معايرة عدم اليقين الفقيرة لمستمع عصبي، مما يجعل تنبؤات عالية اليقين على جمل الرواية. نستكشف من مجموعات المستمعين الفرقة والمقرها الفرقة والتسرب والعثور على أن النتائج السابقة في تحسين كمية عدم اليقين بشكل أفضل. نقيم كل من الأهداف القائمة على السكان بشأن الألعاب المرجعية، وإظهار أن طريقة الفرقة مع معايرة أفضل تمكن المتحدث من توليد الكلام البراغماتية مع التحول إلى مفردات كبيرة وتعميم للألعاب والمستمعين الجديدة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم إثبات مهام معالجة اللغة الطبيعية (NLP)، بدءا من تصنيف النص إلى جيل النص، من خلال نماذج اللغة المحددة مسبقا، مثل بيرت. هذا يسمح للشركات بإنشاء برامج برت أقوى بسهولة عن طريق تثبيت نماذج Berted Brounded لمهام المصب. ومع ذلك، عندما يتم نشر نموذج Berte d Berted كخدمة، فقد يعاني من هجمات مختلفة تم إطلاقها من قبل المستخدمين الضارين. في هذا العمل، نقدم أولا كيف يمكن أن يسرق الخصم خدمة API القائمة على BERT (النموذج الضحية / الهدف) على مجموعات بيانات معطرة متعددة ذات معرفة مسبقة محدودة واستفسارات. نوضح كذلك أن النموذج المستخرج يمكن أن يؤدي إلى هجمات خصومة قابلة للتحويل شديدة ضد نموذج الضحية. تشير دراساتنا إلى أن نقاط الضعف المحتملة لخدمات API القائمة على بيرت لا تزال تعقد، حتى عندما يكون هناك عدم تطابق معماري بين نموذج الضحية ونموذج الهجوم. أخيرا، نبحث في استراتيجيات دفاعتين لحماية نموذج الضحية، وإيجاد أنه ما لم يتم التضحية بأداء نموذج الضحايا، فإن كلا من استخراج النماذج والانتفاخ الخصوم يمكن أن تساوم على نحو فعال النماذج المستهدفة.
يعمل العمل المسبق على جيل البيانات إلى النص، ومهمة تحويل الكلام الرسم البياني (KG) ثلاث مرات إلى نص طبيعي، يركز على مجموعات البيانات القياسية الخاصة بالمجال. ومع ذلك، في هذه الورقة، فإننا ننفذنا اللغة الإنجليزية بأكملها Wikidata KG، ومناقشة التحديات الفريدة المرتبطة بمجال واسع ومجموع واسع النطاق. نوضح كذلك بأنه لفظي كجم شامل ومكون من كجم مثل Wikidata يمكن استخدامه لدمج KGS الهيكلية واللغات الطبيعية. على عكس العديد من البنيات التي تم تطويرها لدمج هاتين المصدرين، فإن نهجنا يحول كجم إلى نص طبيعي، مما يسمح له بالدمج بسلاسة في نماذج اللغة الحالية. إنه يحمل مزايا أخرى لتحسين الدقة الواقعية وتقليل السمية في نموذج اللغة الناتج. نقوم بتقييم هذا النهج عن طريق زيادة عملية استرجاع النموذج لغوي استرجاع وإظهار تحسينات كبيرة على مهام المعرفة المكثفة في المجال المفتوح وكثير المعرفة LAMA.
تستكشف هذه الورقة كيف تؤثر التكنولوجيا، وخاصة الأدوات الرقمية والذكاء الاصطناعي، عمليات نقل اللغة واللغات متعددة اللغات. تقوم تكنولوجيات المعلومات والاتصالات بتمكين أنماط التفاعل الجديدة، مع انتقال أجهزة الكمبيوتر من وسائل الإعلام النقية إلى مولدات ا للغة الفعلية، وإعادة تشكيلها عميقا صناعة الخدمات اللغوية، حيث استمرت أهمية بيانات اللغة ومساعدة المحركات في الارتفاع. نظرا لأن هذه التغييرات تؤثر بشدة على نماذج التواصل واللغات بشكل عام، فإنها تحتاج إلى معالجة ليس فقط من منظور تكنولوجيا المعلومات أو عن طريق الشركات التي يحركها الأعمال، ولكن أيضا في مجال الدراسات الترجمة والتفسيرية، في مناقشة أوسع بين العلماء والممارسين وعند إعداد البرامج التعليمية لتدريب المهنيين اللغوي المتخصصين. يتم تخصيص التركيز الخاص لبعض أحدث التطورات في التعرف التلقائي على التعرف على الكلام والترجمة المنطوقة، وكيفية دفع تطبيقاتها في الترجمة الفورية حدود حالات الاستخدام المعزز في العالم الجديد. وبالتالي، فإن هذا العمل --- عند تقاطع التحقيق النظري والممارسة المهنية والتصميم التعليمي --- يهدف إلى تقديم نظرة عامة تمهيدية على المناظر الطبيعية الحالية وتتصور المسارات المحتملة للسيناريوهات القادمة.
تعرض أنظمة الحوار القائمة على استرجاع أداء متميز عند استخدام نماذج اللغة المدربة مسبقا، والتي تشمل تمثيلات تشفير ثنائية الاتجاه من المحولات (بيرت). خلال اختيار الاستجابة المتعدد التحويل، يركز بيرت على تدريب العلاقة بين السياق مع العديد من الكلام والا ستجابة. ومع ذلك، فإن هذه الطريقة للتدريب غير كافية عند النظر في العلاقات بين كل كلام في السياق. هذا يؤدي إلى مشكلة عدم فهم تدفق السياق تماما المطلوب لتحديد استجابة. لمعالجة هذه المشكلة، نقترح طريقة جديدة بعد التدريب على ما بعد التدريب الجدد تعكس خصائص الحوار متعدد الدورات. على وجه التحديد، يتعلم النموذج تفاعلات مستوى الكلام من خلال التدريب على كل زوج استجابة سياق قصير في جلسة حوار. علاوة على ذلك، باستخدام هدف تدريب جديد، تصنيف صلة النطق، النموذج يفهم الأهمية الدلالية والتماسك بين كلام الحوار. تظهر النتائج التجريبية أن نموذجنا يحقق أحدث حديثة من بين الهوامش الهامة على ثلاثة مجموعات من مجموعات البيانات القياسية. هذا يشير إلى أن طريقة ما بعد التدريب الجيد غير فعالة للغاية لمهمة اختيار الاستجابة.
نسعى إلى إنشاء وكلاء يتصرفون والتواصل مع الوكلاء الآخرين في السعي لتحقيق هدف.تحقيقا لهذه الغاية، نقوم بتمديد الضوء (Urbanek et al. 2019) --- لعبة نصية خيال من الحشد على نطاق واسع - مع مجموعة بيانات من المهام.هذه تحتوي على دوافع لغوية طبيعية مقترنة بأ هداف في اللعبة والمظاهرات البشرية؛قد يتطلب إكمال السعي حوار أو إجراءات (أو كليهما).نقدم نظام لتعليم التعزيز (1) يشتمل على التدريب المستندة إلى النمذجة على النمذجة القائمة على النمذجة على النمذجة على نطاق واسع ومقرها مسبقا لإشراف الوكيل مع البثور ذات الصلة؛و (2) يرفع مساحة عمل عوامل من أوامر العمل والحوار، موازنة بين الاثنين.نقوم بإجراء تقييمات طلقة صفرية باستخدام مظاهرات الخبراء البشرية المحتفظ بها، والتي تبين أن عملائنا قادرون على التصرف باستمرار والتحدث بشكل طبيعي فيما يتعلق بدوافعهم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا