ترغب بنشر مسار تعليمي؟ اضغط هنا

نقل نمط النص: الاستفادة من مصنف نمط على تمثيلات كامنة متشابكة

Text Style Transfer: Leveraging a Style Classifier on Entangled Latent Representations

571   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعلم تمثيل كامن جيد ضروري لنقل نمط النص، والذي يولد جملة جديدة عن طريق تغيير سمات جملة معينة مع الحفاظ على محتواها.تعتمد معظم الأعمال السابقة تمثيل تمثيل كامن Disentangled تعلم تحقيق نقل النمط.نقترح خوارزمية نقل نمط النص الجديد مع تمثيل كامن متشابكا، وإدخال مصنف نمط يمكن أن ينظم الهيكل الكامن ونقل النقل.علاوة على ذلك، تنطبق خوارزمية لنقل النمط على كل من سمة واحدة ونقل السمة المتعددة.تظهر النتائج التجريبية الواسعة أن طريقتنا تتفوق بشكل عام على النهج الحديثة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في معظم الحالات، فإن الافتقار إلى Corpora الموازي يجعل من المستحيل مباشرة على تدريب النماذج الخاضعة للإشراف لمهمة نقل نمط النص.في هذه الورقة، نستكشف خوارزميات التدريب التي تقوم بدلا من ذلك تحسين وظائف المكافآت التي تنظر صراحة في جوانب مختلفة من النوا تج التي يتم تحويلها بالسليب.على وجه الخصوص، نحن نستفيد مقاييس التشابه الدلالي المستخدمة في الأصل لنماذج الترجمة الآلية العصبية بشكل جيد لتقييم الحفاظ على المحتوى بشكل صريح بين مخرجات النظام ونصوص الإدخال.نحقق أيضا في نقاط الضعف المحتملة للمقاييس التلقائية الحالية واقتراح استراتيجيات فعالة لاستخدام هذه المقاييس للتدريب.تظهر النتائج التجريبية أن طرازنا يوفر مكاسب كبيرة في كل من التقييم التلقائي والإنساني على أساس الأساس القوي، مما يشير إلى فعالية أساليبنا المقترحة واستراتيجيات التدريب.
ينطوي نقل نمط النص على إعادة كتابة محتوى الجملة المصدر بأسلوب مستهدف.على الرغم من وجود عدد من المهام النمط مع البيانات المتاحة، فقد كانت هناك مناقشة منهجية محدودة حول كيفية توصيل مجموعات بيانات نمط النص مع بعضها البعض.ومع ذلك، من المحتمل أن يكون لهذا الفهم آثار على اختيار مصادر بيانات متعددة للتدريب على النماذج.في حين أنه من الحكمة النظر في خصائص أسلوبية متأصلة عند تحديد هذه العلاقات، يجب علينا أيضا التفكير في كيفية تحقيق النمط في مجموعة بيانات معينة.في هذه الورقة، نقوم بإجراء العديد من التحليلات التجريبية لمجموعات بيانات أسلوب النص الحالي.بناء على نتائجنا، نقترح تصنيف خصائص أسلوبية وموينة البيانات للنظر عند استخدام أو مقارنة مجموعات بيانات نمط النص.
تعتمد أساليب نقل نمط النص الحالي (TST) على أسلوب الطبقات لتفكيك سمات محتوى النص والأناقة لنقل نمط النص. في حين أن المصنف الأسلوب يلعب دورا حاسما في طرق TST الحالية، لا يوجد تحقيق معروف على تأثيره على أساليب TST. في هذه الورقة، نقوم بإجراء دراسة تجريب ية عن قيود أقراص الطبقات المستخدمة في طرق TST الحالية. لقد أظهرنا أن مصنفات النمط الموجودة لا يمكنهم تعلم بناء جملة الجملة بشكل فعال وفي نهاية المطاف أداء نماذج TST الحالية. لمعالجة هذه المشكلة، نقترح نموذجا جديدا للجيل القابل للتحكم في بناء الجملة، والذي يتضمن مصنف بنمط بناء بناء الجملة يضمن التمثيلات الكامنة المستفادة التي تم التعهد بها بفعالية برياحة هيكل الجملة ل TST. من خلال تجارب واسعة على مهام نقل نمط نصية شعبية، نوضح أن طريقةنا المقترحة تتفوق بشكل كبير على اثني عشر طريقا حديثة. أظهرت دراسات الحالة لدينا أيضا قدرة SACG على توليد جمل ذات أسلوب يستهدف بطلاقة حافظت على المحتوى الأصلي.
تستند نماذج نقل النمط غير المزروعة بشكل رئيسي إلى نهج التعلم الاستقرائي، والذي يمثل النمط كمعلمات أو معلمات فك الترميز، أو معلمات تمييزية، وتطبق مباشرة هذه القواعد العامة لحالات الاختبار. ومع ذلك، فإن عدم وجود Corpus الموازي يعيق قدرة طرق التعلم الاس تقرائي هذه في هذه المهمة. نتيجة لذلك، من المحتمل أن تسبب التعبيرات النمطية غير المتناسقة الشديدة، مثل السلطة غير مهذب ". لمعالجة هذه المشكلة، نقترح نهجا تعليميا عبر جديد في هذه الورقة، بناء على تمثيل نمط السياق على علم الاسترجاع. على وجه التحديد، يتم استخدام وحدة فك ترميز تشفير الاهتمام مع إطار المسترد. أنه ينطوي على الجمل ذات الصلة أعلى K في النمط المستهدف في عملية النقل. وبهذه الطريقة، يمكننا أن نتعلم تضمين أسلوب مدرك السياق لتخفيف مشكلة عدم التناقض أعلاه. في هذه الورقة، يتم استخدام كل من وظائف استرجاع شديد (BM25) ووظائف استرجاع كثيفة (MIPS)، وتم تصميم وظيفتان موضوعيتان لتسهيل التعلم المشترك. تظهر النتائج التجريبية أن أسلوبنا تتفوق على العديد من خطوط الأساس القوية. نهج التعلم المتنقل المقترح عام وفعال لمهمة نقل النمط غير المنسق، وسوف نطبقه على الطريقة الوظيفتين الأخرى في المستقبل.
يمكن أن تكشف نمط النص أن يكشف السمات الحساسة للمؤلف (E.G. العمر والسباق) للقارئ، والذي يمكن، بدوره، يؤدي إلى انتهاكات الخصوصية والتحيز في كل من القرارات البشرية والخضارات على أساس النص. على سبيل المثال، قد تكشف أسلوب الكتابة في تطبيقات الوظائف عن سما ت المرشح المحمية التي يمكن أن تؤدي إلى التحيز في اتخاذ القرارات، بغض النظر عما إذا كانت القرارات التوصية مجددا أو من قبل البشر. نقترح إطارا أساسيا يستند إلى VAE يهدف إلى توضيح الملامح الأسلوبية للنص الذي تم إنشاؤه بشريا من خلال نقل النمط، عن طريق إعادة كتابة النص نفسه تلقائيا. نقدي، يعمل إطار عملنا على فكرة النمط الذي تم توعيته بطريقة مرنة تمكن مفاهيمين متميزين من النمط المباشر: (1) الحد الأدنى من الفكرة التي تتقاطع بشكل فعال أن الأنماط المختلفة التي شوهدت في التدريب، و (2) مفهوم أقصى يسعى إلى التباطؤ بإضافة ميزات أسلوبية لجميع السمات الحساسة إلى النص، ساري المفعول، حوسبة نقابة الأساليب. يمكن استخدام إطار عملنا النمط الخاص بنا لأغراض متعددة، ومع ذلك، فإننا نوضح فعاليته في تحسين نزاهة المصب المصب. نقوم أيضا بإجراء دراسة شاملة عن تأثير تجمع الأنماط على الطلاقة والاتساق الدلالي، وإزالة السمة من النص، في اثنين وثلاث نقل نمط النطاق.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا