ترغب بنشر مسار تعليمي؟ اضغط هنا

ER-AE: جيل نص خاص بالتفاضل لمخاض الإشعال

ER-AE: Differentially Private Text Generation for Authorship Anonymization

374   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تركز معظم دراسات حماية الخصوصية للبيانات النصية على إزالة المعرفات الحساسة الصريحة. ومع ذلك، غالبا ما يتم إهمال أسلوب الكتابة الشخصية، كمؤشر قوي على التأليف،. أظهرت الدراسات الحديثة، مثل SYNTF، نتائج واعدة حول التعدين النصي للحفاظ على الخصوصية. ومع ذلك، لا يمكن خلائطها المجهول فقط إخراج ناقلات المصطلحات الرقمية التي يصعب تفسير المستلمين. نقترح نموذج توليد نص جديد مع وجود آلية أسية ذات مجموعة من مجموعة إخفاء الهوية. من خلال زيادة المعلومات الدلالية من خلال وظيفة مكافأة تدريبية تعزز، يمكن أن يؤدي النموذج إلى إنشاء نص خاص بالتفاضل الذي يحتوي على بنية نحوية دلالية ومماثلة للنص الأصلي أثناء إزالة السمات الشخصية لأسلوب الكتابة. لا يفترض أي ملصقات مشروطة أو بيانات نصية متوازية للتدريب. نحن نقيم أداء النموذج المقترح في مراجعات نظر الأقران الواقعية ومجموعات بيانات مراجعة الصرخة. تشير النتيجة إلى أن نموذجنا يتفوق على أحدث حديثة من الحفظ الدلالي، ومضاءة التأليف، وتحول ستايلومتريك.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لبناء التطبيقات المستندة إلى التعلم في الآلات من أجل المجالات الحساسة مثل الطبية والقانونية، وما إلى ذلك حيث يحتوي النص الرقمي على معلومات خاصة، فإن عدم الكشف عن هويت النص مطلوب للحفاظ على الخصوصية. تسلسل العلامات، على سبيل المثال كما فعلت في التعرف على الكيان المسمى (NER) يمكن أن تساعد في الكشف عن المعلومات الخاصة. ومع ذلك، لتدريب نماذج العلامات على التسلسل، مبلغ كافية من البيانات المسمى مطلوبة ولكن بالنسبة لمجالات حساسة الخصوصية، لا يمكن أيضا مشاركة هذه البيانات المسمى مباشرة. في هذه الورقة، يمكننا التحقيق في تطبيق إطار الحفاظ على الخصوصية لمهام علامات التسلسل، وتحديدا NER. وبالتالي، فإننا نحلل إطارا لمهمة NER، التي تتضمن مستويين لحماية الخصوصية. أولا، نقوم بنشر إطار تعليمي (FLF) الموحد حيث لا يتم مشاركة البيانات المسمى مع الخادم المركزي بالإضافة إلى عملاء الأقران. ثانيا، نطبق الخصوصية التفاضلية (DP) أثناء التدريب النماذج في كل مثيل عميل. في حين أن كلا من تدابير الخصوصية مناسبة للنماذج التي تدرك الخصوصية، فإن تركيبة النتائج في النماذج غير المستقرة. لمعرفةنا، هذه هي الدراسة الأولى من نوعها على نماذج علامات تسلسل الإدراك في الخصوصية.
أظهرت النماذج العصبية الكبيرة المدربة مسبقا تقدما ملحوظا في جيل النص. في هذه الورقة، نقترح إنشاء نص مكيف على البيانات المهيكلة (الجدول) وبادئة (النص المكتوب) من خلال الاستفادة من النماذج المدربة مسبقا. نقدم بيانات جديدة إلى نص البيانات، جدول مع نص مك توب (TWT)، عن طريق إعادة تعيين مجموعات بيانات حالية: Totto و Tabract. يحتوي TWT على تصريحات واقعية ومنطقية مخلصة للبيانات المنظمة، تهدف إلى العمل كمعيار مفيد للجيل المسيطر عليه. بالمقارنة مع إعدادات المهام الحالية إلى النص، يكون TWT أكثر بديهية، يتحكم البادئة (عادة ما يوفرها المستخدم) موضوع النص الذي تم إنشاؤه. عادة ما يتم إخراج الأساليب الحالية النص الهلوسة غير المؤمنين على TWT. لذلك، نقوم بتصميم نهج رواية مع رؤية الاهتمام على أساس الجدول وآلية النسخ على الطاولة. تظهر النتائج التجريبية أن نهجنا يتفوق على الأساليب الحديثة بموجب مقاييس التقييم التلقائي والإنساني.
نقترح النماذج العصبية لتوليد نص من تمثيلات معناية رسمية بناء على هياكل تمثيل الخطاب (DRSS).DRSS هي تمثيلات على مستوى المستند والتي تشفص بالتفاصيل الدلالية الغنية المتعلقة بالعلاقات الخطابية، والافتراض، والتعايش التعاوني داخل وعبر الجمل.نقوم بإضفاء ال طابع الرسمي على مهمة الجيل العصبي DRS إلى النص وتوفير حلول النمذجة لمشاكل طلب الشرط وتسمية التسمية المتغيرة التي تجعل الجيل من DRSS غير تافهة.يعتمد مولدنا على نموذج Treelstm الرواية القادرة على تمثيل هياكل DRS بدقة وهو مناسب بشكل عام للأشجار ذات فروع واسعة.نحقق أداء تنافسي (59.48 بلو) على معيار GMB ضد العديد من خطوط الأساس القوية.
الوصف التحليلي للمخططات هو منطقة بحثية ومهمة ذات العديد من التطبيقات في الأوساط الأكاديمية والصناعة.ومع ذلك، فقد تلقت هذه المهمة الصعبة اهتماما محدودا من مجتمع أبحاث اللغويات الحاسوبية.تقترح هذه الورقة Autochart، مجموعة بيانات كبيرة للوصف التحليلي لل مخططات، التي تهدف إلى تشجيع المزيد من البحث في هذا المجال الهام.على وجه التحديد، نقدم إطارا جديدا ينشئ المخططات ووصفها التحليلي تلقائيا.أجرينا تقييما واسع النطاق للإنسان والآلات على الرسوم البيانية والأوصاف التي تم إنشاؤها وإظهار أن النصوص التي تم إنشاؤها مفيدة ومتماسكة وذات صلة بالمخططات المقابلة.
غالبا ما تظهر اللغة الطبيعية هيكل هرمي متأصل متأرجلا مع بناء جملة معقدة ودليل. ومع ذلك، تعلم معظم النماذج الإدارية العميقة في أحدث تضمينها فقط في مساحة ناقلات Euclidean، دون محاسبة هذه الملكية الهيكلية للغة. في هذه الورقة، نحقق في جيل النص في مساحة ك امنة ضئيلة لتعلم التمثيلات الهرمية المستمرة. يتم تقديم AutoNECODER AUTONICODER AUTONCODER (APO-VAE)، حيث يتم تعريف كل من الخلفية السابقة والتنتهي من المتغيرات الكامنة عبر كرة شاذة عبر التوزيعات العادية ملفوفة. من خلال اعتماد الصيغة البدائية المزدوجة لمخلاص Kullback-Leibler، يتم تقديم إجراء تعلم الخصم لتمكين التدريب النموذجي القوي. توضح تجارب واسعة النمذجة في النمذجة اللغوية ونقل النمط غير المعقول وتوليد استجابة الحوار فعالية نموذج APO-VAE المقترح على VAES في الفضاء الكامن Euclidean، وذلك بفضل قدراته الرائعة في التقاط التسلسلات الهرمية للغة الكامنة في الفضاء القطعي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا