ترغب بنشر مسار تعليمي؟ اضغط هنا

محادثة غير مدفوعة من خلال التدريب المشترك

Unsupervised Conversation Disentanglement through Co-Training

298   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

محادثة Deventangle تهدف إلى فصل الرسائل المتداخلة إلى جلسات منفصلة، ​​وهي مهمة أساسية في فهم المحادثات متعددة الأحزاب. يعتمد العمل الحالي في محادثة DEVENTANGLEMELE بشكل كبير على مجموعات البيانات المشروح البشرية، وهي مكلفة للحصول عليها في الممارسة العملية. في هذا العمل، نستكشف تدريب نموذج محادثة محادثة دون الرجوع إلى أي شروح بشرية. تم بناء طريقتنا على خوارزمية التدريب العميق، والتي تتكون من شبكات اثنين من الشبكات العصبية: مصنف رسالة للزوج وفيديو الجلسة. السابق هو المسؤول عن استرجاع العلاقات المحلية بين رسالتين بينما يقتصر الأخير رسالة إلى جلسة من خلال التقاط معلومات السياق. يتم تهيئة كلتا الشبكتين على التوالي مع بيانات زائفة مبنية من Corpus غير المخلفات. خلال عملية التدريب التعويضي العميق، نستخدم مصنف الجلسة كمكون تعليمي للتعزيز لتعلم جلسة تعيين سياسة من خلال تعظيم المكافآت المحلية التي قدمها مصنف زوج الرسائل. بالنسبة إلى مصنف زوج الرسائل، فإننا نشعر بإثراء بيانات التدريب الخاصة بها عن طريق استرداد أزواج الرسائل بثقة عالية من جلسات DESTANGLED المتوقعة من قبل مصنف الجلسة. النتائج التجريبية على مجموعة بيانات حوار السينما الكبيرة تثبت أن نهجنا المقترح يحقق أداء تنافسي مقارنة بالأساليب الخاضعة للإشراف السابقة. تشير المزيد من التجارب إلى أن محادثات الإعصابات المتوقعة يمكن أن تعزز الأداء على المهمة المصب لمختيار استجابة متعددة الأحزاب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تتحول نماذج المحادثة واسعة النطاق إلى الاستفادة من المعرفة الخارجية لتحسين الدقة الواقعية في توليد الاستجابة.بالنظر إلى عدم التعليق على المعرفة الخارجية لعوريا الحوار واسعة النطاق، من المستحسن معرفة اختيار المعرفة وتوليد الاستجابة بطريقة غير منشأة.في هذه الورقة، نقترح أفلاطون كاج (توليد المعرفة المعزز)، ونهج تعليمي غير مخطط له لنمذجة المحادثة المحفوظة على المعرفة الطرفية.لكل سياق حوار، يتم اختيار عناصر المعرفة ذات الصلة من الأعلى وبعد ذلك في توليد الاستجابة المدرجة في المعرفة.يتم تحسين مكونين اختيار المعرفة وتوليد الاستجابة بشكل مشترك وفعال تحت هدف متوازن.النتائج التجريبية على اثنين من مجموعات البيانات المتاحة للجمهور التحقق من تفوق أفلاطون كاج.
حققت الترجمة الآلية العصبية غير الخاضعة للرقابة (UNMT) التي تعتمد فقط على Glassive Monolingual Corpora نتائج ملحوظة في العديد من مهام الترجمة.ومع ذلك، في سيناريوهات العالم الواقعي، لا توجد سورانيا أحادية الأبعاد الضخمة لبعض لغات الموارد المنخفضة للغا ية مثل أنظمة الإستونية، وعادة ما تؤدي أنظمة بعثة الأمم المتحدة في غرة الأبراج بشكل سيئ عندما لا يكون هناك كائنات تدريب كافية لغات واحدة.في هذه الورقة، نقوم أولا بتحديد وتحليل سيناريو البيانات التدريبية غير المتوازنة لإدارة بروتوكولية الكونغراف.استنادا إلى هذا السيناريو، نقترح آليات التدريب الذاتي لجهاز مكافآت لتدريب نظام INMT قوي وتحسين أدائها في هذه الحالة.تظهر النتائج التجريبية على العديد من أزواج اللغة أن الأساليب المقترحة تتفوق بشكل كبير على نظم التعطيب التقليدية.
كانت جودة تلخيص الجماعة لديها تحسينات كبيرة منذ تقنيات محاكاة اللغة الأخيرة.ومع ذلك، هناك حاليا نقص في مجموعات البيانات للاحتياجات المتزايدة لتطبيقات تلخيص المحادثة.وبالتالي نحن جمعنا منتديات، مجموعة بيانات ملخصة محادثة متنوعة وعالية الجودة مع ملخصات مكتوبة بشرية.تتم جمع المحادثات في DiversionMum DataSet من مجموعة واسعة من منتديات الإنترنت.لجعل مجموعة البيانات قابلة للتوسيع بسهولة، نقوم أيضا بإصدار عملية إنشاء DataSet.تظهر تجاربنا أن النماذج المدربة على Forumsum لديها أفضل صفر - لقدرة على تحويل القليل من الطوابق إلى مجموعات البيانات الأخرى من بيانات ملخصات الدردشة الكبيرة الحالية Samsum.نظهر أيضا أن استخدام Corpus Corpustation للمحدثين يحسن ما قبل التدريب على تحسين جودة نموذج تلخيص الدردشة.
لتسليط الضوء على تحديات تحقيق تنصيب تمثيل المجال النصي في إعداد غير محدد، في هذه الورقة نقوم بتحديد مجموعة تمثيلية من النماذج المطبقة بنجاح من مجال الصورة.نحن نقيم هذه النماذج على 6 مقاييس DEFENTANCE، وكذلك على مهام التصنيف المصب والمهماطوب.لتسهيل ال تقييم، نقترح اثنين من مجموعات البيانات الاصطناعية مع عوامل تابعة معروفة.تبرز تجاربنا الفجوة الموجودة في المجال النصي وتوضح أن بعض العناصر مثل التمثيل SPARSITY (كحيز حثي)، أو اقتران التمثيل مع وحدة فك الترميز يمكن أن يؤثر على deventanglement.إلى حد ما من معرفتنا، فإن عملنا هو المحاولة الأولى لتقاطع تحسس وتصوير تمثيل غير مدهش، ويوفر الإطار التجريبي ومجموعات البيانات لفحص التطورات المستقبلية في هذا الاتجاه.
المهام المشتركة لها تاريخ طويل وأصبحت السائدة لأبحاث NLP. تتطلب معظم المهام المشتركة المشاركين تقديم مخرجات وأوصاف النظام فقط. من غير المألوف أن تطلب المهمة المشتركة تقديم النظام نفسه بسبب قضايا الترخيص وفروق التنفيذ. لذلك، يتم التخلي عن العديد من ال أنظمة دون استخدامها في التطبيقات الحقيقية أو المساهمة في أنظمة أفضل. في هذا البحث، نقترح مخططا للاستفادة من كل تلك النظم التي شاركت في المهام المشتركة. نستخدم جميع مخرجات النظام المشارك كمعلمي المهام في هذا المخطط وتطوير نموذج جديد كطالب يهدف إلى تعلم خصائص كل نظام. نسمي هذا التدريس المشترك بين المخطط. "هذا المخطط يخلق نظام موحد يؤدي أفضل من أفضل نظام المهام الموحد. يتطلب فقط مخرجات النظام، والجهد الإضافي قليلا هناك حاجة إلى المشاركين والمنظمين. نحن نطبق هذا المخطط على المهمة المشتركة Shinra2019-JP، التي لديها تسعة مشاركين بدقة مختلفة من الإخراج، مما يؤكد أن النظام الموحد يتفوق على أفضل نظام. علاوة على ذلك، تم إصدار الرمز المستخدم في تجاربنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا