الفهم القراءة الآلة التفاعلية (IMRC) هو مهام فهم الجهاز حيث تكون مصادر المعرفة يمكن ملاحظتها جزئيا.يجب أن يتفاعل الوكيل مع بيئة بالتتابع لجمع المعرفة اللازمة من أجل الإجابة على سؤال.نحن نفترض أن تمثيلات الرسم البياني هي تحيزات حثي جيدة، والتي يمكن أن
تكون بمثابة آلية ذاكرة الوكيل في مهام IMRC.نستكشف أربع فئات مختلفة من الرسوم البيانية التي يمكنها التقاط معلومات نصية على مختلف المستويات.نحن تصف الأساليب التي تقوم ببناء وتحديث هذه الرسوم البيانية هذه ديناميكيا أثناء جمع المعلومات، وكذلك النماذج العصبية لتشفير تمثيلات الرسم البياني في وكلاء RL.تشير تجارب واسعة النطاق على ISquad إلى أن تمثيلات الرسم البياني يمكن أن تؤدي إلى تحسينات كبيرة في الأداء لعوامل RL.
في الآونة الأخيرة، يركز غالبية الباحثين تحليل المعنويات على تحليل المعنويات المستندة إلى الهدف لأنه يوفر تحليلا متعمقا بنتائج أكثر دقة بالمقارنة مع تحليل المعنويات التقليدية.في هذه الورقة، نقترح نهجا تعليميا تفاعليا لمعالجة مهمة تحليل المعنويات المست
ندة إلى الهدف للغة العربية.يستخدم نموذج IA-LSTM المقترح آلية تفاعلية تعتمد على الانتباه لإجبار النموذج على التركيز على أجزاء مختلفة (أهداف) من الجملة.نحن نبحث في القدرة على استخدام الأهداف والحق الأيمن والأيسر، ونموذجها بشكل منفصل لتعلم تمثيلاتهم الخاصة عبر النمذجة التفاعلية.قمنا بتقييم نموذجنا على مجموعة بيانات مختلفة: مراجعة الفنادق العربية ومجموعات بيانات مراجعة الكتاب العربية.توضح النتائج فعالية استخدام هذه التقنية النمذجة التفاعلية للمهمة القائمة على الأهداف العربية.حصلت النموذج على قيم دقة 83.10 مقارنة بنماذج Sota مثل AB-LSTM-PC والتي حصلت على 82.60 لنفس مجموعة البيانات.
استخراج العلاقات هو الترجمة الفرعية لمعالجة Langage الطبيعية التي شهدت العديد من التحسينات في السنوات الأخيرة، مع ظهور البنية المعقدة المدربة مسبقا. يتم اختبار العديد من هذه النهج من هذه النهج من المعايير مع الجمل المسماة التي تحتوي على كيانات الموسو
مة، وتتطلب التدريب المسبق الهامة والضبط بشكل جيد على البيانات الخاصة بالمهام. ومع ذلك، في سيناريو حقيقي للاستخدام، مثل في شركة صحيفة في الغالب مخصصة لمعلومات المحلية، فإن العلاقات هي من نوع متنوع للغاية، مع عدم وجود بيانات مشروح تقريبا لمثل هذه العلاقات، والعديد من الكيانات تعاني في جملة دون أن تكون ذات صلة. نشكك في استخدام النماذج الإشرفة من أحدث النماذج في هذا السياق، حيث توجد موارد مثل الوقت والحوسبة وقوة الحوسبة والنحاذج البشرية محدودة. للتكيف مع هذه القيود، نقوم بتجربة خط أنابيب استخراج التعلم في التعلم النشط، وتتألف من نموذج خفيف الوزن يستند إلى LSTM ثنائي للكشف عن العلاقات الموجودة، ونموذج أحدث لتصنيف العلاقة. قارن العديد من الخيارات لنماذج التصنيف في هذا السيناريو، من الكلمة الأساسية لتضمين المتوسط، على الرسم البياني للشبكات العصبية وتلك القائمة على برت، وكذلك العديد من استراتيجيات الاستحواذ النشطة للتعلم، من أجل إيجاد نهج الأكثر كفاءة من حيث التكلفة ولكن دقيقة في موقعنا أكبر حالة استخدام شركة صحيفة صحيفة الفرنسية.
نحن نحقق في ما إذا كان هناك نموذج يمكن أن يتعلم اللغة الطبيعية مع الحد الأدنى من المدخلات اللغوية من خلال التفاعل.معالجة هذا السؤال، نقوم بتصميم وتنفيذ لعبة تعليمية تفاعلية تتعلم التمثيلات الدلالية المنطقية تكوين.تتيح لنا لعبتنا استكشاف فوائد الاستدل
ال المنطقي لتعلم اللغة الطبيعية.يوضح التقييم أن النموذج يمكن أن يضيق بدقة التمثيلات المنطقية المحتملة للكلمات على مدار اللعبة، مما يشير إلى أن نموذجنا قادر على تعلم تعيينات معجمية من الصفر بنجاح.
يمكن أن تسبب التحيزات والتحف في البيانات التدريبية في سلوك غير مرحب به في نصوص النص (مثل مطابقة النمط الضحل)، مما يؤدي إلى عدم القدرة على التعميم.أحد الحلول لهذه المشكلة هو إدراج المستخدمين في الحلقة والاستفادة تعليقاتهم لتحسين النماذج.نقترح خط أنابي
ب تصحيح توضيحي جديد يسمى Hildif، مما يتيح البشر لتحسين أقراص نصية عميقة باستخدام وظائف التأثير كطريقة تفسير.نقوم بتجربة مهمة الاستدلال باللغة الطبيعية (NLI)، والتي تبين أن Hildif يمكن أن تخفف من مشاكل القطع الأثرية بشكل فعال في نماذج بيرت التي تم ضبطها بشكل جيد وتؤدي إلى زيادة التعميم النموذجي.
تحسنت جودة الترجمات التي تم إنشاؤها بواسطة أنظمة الترجمة الآلية (MT) بشكل كبير خلال السنوات، لكننا لا نزال بعيدا للحصول على ترجمات عالية الجودة التلقائية بالكامل.لتوليدهم والمترجمين يستفيدون من أدوات الترجمة المساعدة بمساعدة الكمبيوتر وبينها نجد أنظم
ة الترجمة الآلية التفاعلية (IPMT).في هذه الورقة، نستخدم ملاحظات الحساب على أنها المعلومات الرئيسية والوحيدة اللازمة لإنشاء تنبؤات جديدة تصحح الترجمات السابقة.يقلل تطبيق ملاحظات الحساب بشكل كبير من عدد الكلمات التي يحتاجها المترجم إلى كتابة جلسة IPMT.في الختام واستخدام هذه التقنية يوفر وقتا مفيدا وجهده للمترجمين وتحسين أدائها مع التقدم المستقبلي في MT وهكذا نوصي بتطبيقها في أنظمة IPMT الفعلية.
يعد تقليل انهيار الاتصالات أمرا بالغ الأهمية للنجاح في تطبيقات NLP التفاعلية، مثل أنظمة الحوار.تحقيقا لهذه الغاية، نقترح إطارا لتخفيف الارتباك لكشف وعلاج انهيار الاتصالات.في هذا العمل، كخطوة أولى نحو تنفيذ هذا الإطار، نركز على الكشف عن مصادر الفونيم
للارتباك.كدليل من المفهوم، نقوم بتقييم اثنين من المهندسين العصبيين في التنبؤ بالاحتمال الذي سيؤديه المستمع إلى إساءة فهم الصوت في الكلام.نظير على أن كلتا النماذج العصبية تتفوق على خط أساس نجم نجم مرجح، يظهر وعد مبكرا للإطار الأوسع.
الترجمة التنبؤية التفاعلية هي عملية تكرارية تعاونية وحيث تنتج مترجمات البشر الترجمات بمساعدة أنظمة الترجمة الآلية (MT) بشكل تفاعلي. توجد تقنيات أخذ العينات المختلفة في التعلم النشط (AL) لتحديث نموذج MT (NMT) العصبي في السيناريو التفاعلي التنبؤ بالتنب
ؤ. في هذه الورقة، نستكشف مصطلح مقرها (NEC Count Entity Content (NEC) والجودة (تقدير الجودة (QE) وتقنيات الإشارة (SIM) (SIM)) - والتي تستخدم للعثور على المرشحين المثاليين من البيانات الواردة - للإشراف البشري وتحديث الوزن نموذج MT. نفذنا تجارب مع ثلاث أزواج ولغوية وبيزن. الألمانية-العربية والإسبانية والإنجليزية والهندية الإنجليزية. تنتج تقنية أخذ العينات المقترحة لدينا 1.82 و 0.77 و 0.81 نقطة من نقاط بلو للغة الألمانية والإنجليزية والإسبانية والإنجليزية والإنجليزية والإنجليزية على التوالي وعلى أساس الأساس الأساسي في أخذ العينات العشوائية. كما أنه يحسن الوضع الحالي بمقدار 0.35 و 0.12 نقطة بلو للألمانية والإنجليزية والإسبانية والإنجليزية على التوالي. يحسن جهود التحرير البشري من حيث عدد الكلمات المتغيرة أيضا بنسبة 5 و 4 نقاط للألمانية والإنجليزية والإسبانية والإنجليزية على التوالي ومقارنة مع أحدث من بين الفن.
هناك اهتمام متزايد بالمساعدين الظاهريين مع قدرات متعددة الوسائط، على سبيل المثال، استنتاج سياق محادثة من خلال فهم المشهد. تعالج مجموعة بيانات محادثات متعددة الوسائط المتعددة (SIMMC) التي تم إصدارها مؤخرا هذا الاتجاه من خلال تمكين البحث عن إنشاء مساعد
ين افتراضي، قادرين على مراعاة المشهد الذي يراه المستخدم عند التحدث مع المستخدم ويتفاعل أيضا مع العناصر الموجودة في المشهد. DataSet SIMMC هو رواية في أنه يحتوي على حوار مساعد للمستخدم المشروح بالكامل، ومساعدات موجهة نحو المهام حيث يراقب المستخدم ومشاركة مساعد نفس العناصر المرئية والأخير إجراء إجراءات لتحديث المشهد. أدفع تحدي SIMMC، الذي عقد كجزء من تحدي تكنولوجيا نظام الحوار ثمين (DSTC9)، تطوير النماذج المختلفة التي تضع معا مجموعة جديدة من الفن في مجموعة بيانات SIMMC. في هذا العمل، قارننا وتحليل هذه النماذج لتحديد ما عملت؟ "، والفجوات المتبقية؛ Whatnext؟ '. يوضح تحليلنا أنه على الرغم من أن نماذج اللغة المحددة مسبقا تتكيف مع هذه المجموعة تظهر وعد كبير، فهناك مؤشرات على أن السياق المتعدد غير المستخدمة بالكامل، وهناك حاجة إلى تكامل قاعدة معرفة أفضل وقابل للتطوير. نأمل أن يوفر هذا التحليل الأول من نوع نماذج SIMMC رؤى وفرصا مفيدا لمزيد من البحث في وكلاء المحادثة متعددة الوسائط
وصفنا العمل بالتقدم المحرز في تدريب روبوت بشري لإنتاج ذراع أيقونة وإيماءات الرأس كجزء من تفاعل الحوار الموجه نحو المهام.ينطوي ذلك على تطوير واستخدام مدير حوار متعدد الوسائط لغير الخبراء في البرنامج بسرعة "الروبوت من خلال الكلام والرؤية.باستخدام مدير
الحوار هذا، يتم جمع مقاطع الفيديو من مظاهرات الإيماءات.يتم استخراج مراكز السيارات من مقاطع الفيديو هذه لتحديد مسارات السيارات حيث تستخدم مجموعات من مسارات السيارات لإنتاج إيماءات الروبوت بعد نهج مخاليط غاوسي.تعتبر المناقشة الختامية كيف يمكن استخدام التمثيلات المستفادة لإيماءة الإيماءات من قبل الروبوت، وكيف قد ينضج الإطار في نظام لمعالجة التأسيس اللغوي والتمثيل الدلالي.