ينطوي نقل نمط النص على إعادة كتابة محتوى الجملة المصدر بأسلوب مستهدف.على الرغم من وجود عدد من المهام النمط مع البيانات المتاحة، فقد كانت هناك مناقشة منهجية محدودة حول كيفية توصيل مجموعات بيانات نمط النص مع بعضها البعض.ومع ذلك، من المحتمل أن يكون لهذا الفهم آثار على اختيار مصادر بيانات متعددة للتدريب على النماذج.في حين أنه من الحكمة النظر في خصائص أسلوبية متأصلة عند تحديد هذه العلاقات، يجب علينا أيضا التفكير في كيفية تحقيق النمط في مجموعة بيانات معينة.في هذه الورقة، نقوم بإجراء العديد من التحليلات التجريبية لمجموعات بيانات أسلوب النص الحالي.بناء على نتائجنا، نقترح تصنيف خصائص أسلوبية وموينة البيانات للنظر عند استخدام أو مقارنة مجموعات بيانات نمط النص.
Text style transfer involves rewriting the content of a source sentence in a target style. Despite there being a number of style tasks with available data, there has been limited systematic discussion of how text style datasets relate to each other. This understanding, however, is likely to have implications for selecting multiple data sources for model training. While it is prudent to consider inherent stylistic properties when determining these relationships, we also must consider how a style is realized in a particular dataset. In this paper, we conduct several empirical analyses of existing text style datasets. Based on our results, we propose a categorization of stylistic and dataset properties to consider when utilizing or comparing text style datasets.
المراجع المستخدمة
https://aclanthology.org/
تعلم تمثيل كامن جيد ضروري لنقل نمط النص، والذي يولد جملة جديدة عن طريق تغيير سمات جملة معينة مع الحفاظ على محتواها.تعتمد معظم الأعمال السابقة تمثيل تمثيل كامن Disentangled تعلم تحقيق نقل النمط.نقترح خوارزمية نقل نمط النص الجديد مع تمثيل كامن متشابكا،
تعتمد أساليب نقل نمط النص الحالي (TST) على أسلوب الطبقات لتفكيك سمات محتوى النص والأناقة لنقل نمط النص. في حين أن المصنف الأسلوب يلعب دورا حاسما في طرق TST الحالية، لا يوجد تحقيق معروف على تأثيره على أساليب TST. في هذه الورقة، نقوم بإجراء دراسة تجريب
في معظم الحالات، فإن الافتقار إلى Corpora الموازي يجعل من المستحيل مباشرة على تدريب النماذج الخاضعة للإشراف لمهمة نقل نمط النص.في هذه الورقة، نستكشف خوارزميات التدريب التي تقوم بدلا من ذلك تحسين وظائف المكافآت التي تنظر صراحة في جوانب مختلفة من النوا
تستند نماذج نقل النمط غير المزروعة بشكل رئيسي إلى نهج التعلم الاستقرائي، والذي يمثل النمط كمعلمات أو معلمات فك الترميز، أو معلمات تمييزية، وتطبق مباشرة هذه القواعد العامة لحالات الاختبار. ومع ذلك، فإن عدم وجود Corpus الموازي يعيق قدرة طرق التعلم الاس
تأخذ مهمة نقل النمط (النمط هنا بمعنى "هنا" مع العديد من الجوانب بما في ذلك التسجيل، وهيكل الجملة، واختيار المفردات) إجراء إدخال النص وإعادة كتابةها في نمط مستهدف محدد يحافظ على المعنى، ولكن تغيير نمط نص المصدر لمطابقة ذلك من الهدف. يعتمد الكثير من ال