تم استكشاف نقل النمط على نطاق واسع في توليد اللغة الطبيعية مع استخراج Corpus غير الموازي بشكل مباشر أو غير مباشر فكرة من النمط من مصدر المجال المصدر والمستهدف. يعد القصور المشترك للنهج القائمة شرط التعليقات التوضيحية المشتركة في جميع الأبعاد الأسلوبية قيد النظر. يوفر توفر مجموعة البيانات هذه عبر مزيج من الأساليب من امتداد هذه الإعدادات إلى أبعاد أسلوب متعددة. في حين أن النماذج المتتالية الأبعاد المتتالية عبر أنماط متعددة هي احتمال، فإنه يعاني من خسارة المحتوى، خاصة عندما لا تكون أبعاد النمط مستقلة تماما عن بعضها البعض. في عملنا، نترخى هذا الشرط للبيانات المشروح بشكل مشترك عبر أنماط متعددة باستخدام البيانات المكتسبة بشكل مستقل عبر أبعاد نمط مختلفة دون أي شروح إضافية. نقوم بتهيئة إعداد برنامج فك تشفير التشفير مع طراز اللغة المستندة إلى المحول المدرب مسبقا على كائن عام وتعزيز قدرته على إعادة كتابة الأبعاد ذات الأرقام المستهدفة المتعددة عن طريق توظيف نماذج لغة واضحة على الطراز كتمييز. من خلال التقييم الكمي والنوعي، نعرض قدرة نموذجنا على التحكم في الأساليب عبر أبعاد أسلوب متعددة مع الحفاظ على محتوى نص الإدخال. قارنناها مع خطوط الأساس التي تنطوي على نماذج نقل أسلوب UNI-VIDELAL لحكام أحادي الأبعاد.
Style transfer has been widely explored in natural language generation with non-parallel corpus by directly or indirectly extracting a notion of style from source and target domain corpus. A common shortcoming of existing approaches is the prerequisite of joint annotations across all the stylistic dimensions under consideration. Availability of such dataset across a combination of styles limits the extension of these setups to multiple style dimensions. While cascading single-dimensional models across multiple styles is a possibility, it suffers from content loss, especially when the style dimensions are not completely independent of each other. In our work, we relax this requirement of jointly annotated data across multiple styles by using independently acquired data across different style dimensions without any additional annotations. We initialize an encoder-decoder setup with transformer-based language model pre-trained on a generic corpus and enhance its re-writing capability to multiple target style dimensions by employing multiple style-aware language models as discriminators. Through quantitative and qualitative evaluation, we show the ability of our model to control styles across multiple style dimensions while preserving content of the input text. We compare it against baselines involving cascaded state-of-the-art uni-dimensional style transfer models.
المراجع المستخدمة
https://aclanthology.org/
في معظم الحالات، فإن الافتقار إلى Corpora الموازي يجعل من المستحيل مباشرة على تدريب النماذج الخاضعة للإشراف لمهمة نقل نمط النص.في هذه الورقة، نستكشف خوارزميات التدريب التي تقوم بدلا من ذلك تحسين وظائف المكافآت التي تنظر صراحة في جوانب مختلفة من النوا
يمكن جمع كميات كبيرة من سجلات التفاعل من أنظمة NLP التي يتم نشرها في العالم الحقيقي.كيف يمكن الاستفادة من هذه الثروة من المعلومات؟يعد استخدام سجلات التفاعل هذه في إعداد تعليم التعزيز (RL) غير متصل نهجا واعدا.ومع ذلك، نظرا لطبيعة مهام NLP وقيود أنظمة
في الآونة الأخيرة، أصبح مجتمع الترجمة الآلية أكثر اهتماما بالتقييم على مستوى المستندات خاصة في ضوء ردود الفعل على مطالبات التكافؤ البشري "، لأن دراسة الجودة على مستوى الوثيقة بدلا من مستوى الحكم يسمح بذلكتقييم السياق Suprasententents، توفير تقييم أكث
هذه الاستعراضات الورقة وتلخص ممارسات التقييم البشري الموضحة في 97 ورقة نقل النمط فيما يتعلق بثلاثة جوانب التقييم الرئيسية: نقل النمط، والمعنى بالحفظ، والطلاقة.من حيث المبدأ، يجب أن تكون التقييمات من قبل راتبي البشر هي الأكثر موثوقية.ومع ذلك، في أوراق
توضح هذه الورقة مشروع Glaux (اللغة اليونانية الآلية ")، بذل جهد مستمر لتطوير كورب غاميرية طويلة الأجل من اليونانية، تغطي ستة عشر قرنا من المواد الأدبية وغير الأدبية المشروح مع طرق NLP.بعد تقديم نظرة عامة على مشاريع Corpus ذات الصلة ومناقشة الهندسة ال