ترغب بنشر مسار تعليمي؟ اضغط هنا

البحث عن مدافع فعال: معيار الدفاع ضد استبدال كلمة العدسات

Searching for an Effective Defender: Benchmarking Defense against Adversarial Word Substitution

137   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أظهرت الدراسات الحديثة أن النماذج العميقة العصبية المستندة إلى الشبكة المعرضة للأمثلة المصنوعة عن قصد، ويقترح أساليب مختلفة للدفاع ضد هجمات استبدال الكلمات العدائية لنماذج NLP العصبية. ومع ذلك، هناك نقص في الدراسة المنهجية حول مقارنة النهج الدفاعية المختلفة بموجب نفس الإعداد الهجومية. في هذه الورقة، نسعى إلى ملء فجوة الدراسات المنهجية من خلال أبحاث شاملة بشأن فهم سلوك مصنفات النص العصبي المدربين من قبل طرق دفاعية مختلفة بموجب هجمات المشدلات التمثيلية. بالإضافة إلى ذلك، نقترح طريقة فعالة لزيادة تحسين متانة المصنفات النصية العصبية ضد هذه الهجمات، وحققت أعلى دقة على كل من الأمثلة النظيفة والمنعدة على مجموعات بيانات Agnews و IMDB بمهامش مهم. نأمل أن توفر هذه الدراسة أدلة مفيدة للبحث في المستقبل على الدفاع المشددي النصي. تتوفر الرموز في https://github.com/rockylzy/textdefender.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

غالبا ما تنطوي النماذج الحسابية للغة البشرية على مشاكل في الحركة. على سبيل المثال، قد تهميش محلل احتمامي على العديد من الأشجار بشكل كبير لجعل التنبؤات. غالبا ما تستخدم الخوارزميات لمثل هذه المشكلات البرمجة الديناميكية وليست فريدة من نوعها دائما. يمكن أن يكون العثور على واحد مع وقت تشغيل مقارب مثالي غير محدد، ويستغرق وقتا طويلا، وعرضة خطأ. يهدف عملنا إلى أتمتة هذه العملية الشاقة. بالنظر إلى برنامج إعلاني صحيح أولي، فإننا نبحث عن تسلسل من التحولات التي تحافظ على الدلالات لتحسين وقت التشغيل قدر الإمكان. تحقيقا لهذه الغاية، وصفنا مجموعة من تحويلات البرامج، وهي مترية بسيطة لتقييم كفاءة البرنامج المحول، وإجراءات البحث المثيرة لتحسين هذه المترية. نظهر أنه في الممارسة العملية، البحث الآلي - - مثل البحث العقلي الذي يؤديه مبرمجات البشر --- يمكن العثور على تحسينات كبيرة في البرنامج الأولي. تجريبيا، نظرا لأن العديد من عمليات السرعة الموصوفة في أدب NLP قد تم اكتشافها تلقائيا من خلال نظامنا.
تعد نماذج معالجة وأمن معالجة اللغة الطبيعية (NLP) مهمة بشكل ملحوظ في تطبيقات العالم الحقيقي. في سياق مهام تصنيف النص، يمكن تصميم أمثلة الخصومة من خلال استبدال الكلمات مع المرادفات تحت بعض القيود الدلالية والمنظمات الأساسية، بحيث يكون نموذج مدرب جيدا سيعطي تنبؤا خاطئا. لذلك، من الأهمية بمكان تطوير تقنيات لتوفير ضمان قوي وقضايا ضد هذه الهجمات. في هذه الورقة، نقترح WordDP لتحقيق متانة مصدقة ضد استبدال الكلمات في تصنيف النص عن طريق الخصوصية التفاضلية (DP). نحدد العلاقة بين موانئ دبي والمودة القومية لأول مرة في المجال النصي واقتراح خوارزمية قائمة على الآلية المفاهيمية التي تعتمد على الآلية لتحقيق القابة رسميا. ونحن نقدم كذلك آلية أسيانية محاكاة عملية لها استنتاج فعال مع متانة معتمدة. نحن لا نقدم فقط اشتقاق تحليلي صارم للحالة المعتمدة ولكن أيضا مقارنة فائدة WordDP أيضا بشكل تجريبي مع خوارزميات الدفاع الحالية. تظهر النتائج أن WordDP تحقق دقة أعلى وأكثر من 30x تحسن كفاءة على آلية متانة حديثة معتمدة في مهام تصنيف النص النموذجي.
نقترح أول هجوم مقاوم للتدرج على المستوى العام على نماذج المحولات.بدلا من البحث عن مثال خصم واحد، نبحث عن توزيع الأمثلة الخصومة المعلمة بواسطة مصفوفة مستمرة قيمة، وبالتالي تمكين التحسين المستندة إلى التدرج.إننا نوضح تجريبيا أن هجومنا الأبيض الخاص بنا يصل إلى أداء الهجوم الحديثة في مجموعة متنوعة من المهام اللغوية الطبيعية، مما يتفوق على العمل السابق من حيث معدل النجاح العديي مع مطابقة غير محسنة حسب التقييم الآلي والبشري.علاوة على ذلك، نظير على أن هجوم قوي عبر الصندوق الأسود، تم تمكينه بواسطة أخذ العينات من التوزيع العديزي أو يطابق أو يتجاوز الطرق الحالية، في حين يتطلب فقط مخرجات التسمية الصعبة.
لقد أظهرت الأدوات الحديثة الأخيرة أن نماذج تعلم الرسم البياني المعرفي (KG) عرضة للغاية للهجمات الخصومة.ومع ذلك، لا تزال هناك ندرة من تحليلات الضعف لمحاذاة الكيان المتبادلة تحت هجمات الخصومة.تقترح هذه الورقة نموذج هجوم مخدر مع تقنيات هجومين جديدة لإشر اض هيكل كجم وتدلل جودة محاذاة الكيان المتبادلة العميقة.أولا، يتم استخدام طريقة تعظيم كثافة الكيان لإخفاء الكيانات المهاجمة في المناطق الكثيفة في كلكتين، بحيث تكون الاضطرابات المشتقة غير ملحوظة.ثانيا، تم تطوير طريقة تضخيم إشارة الهجوم لتقليل مشاكل التلاشي التجريبية في عملية الهجمات الخصومة لمزيد من تحسين فعالية الهجوم.
تعد Word Embeddings مكونا أساسيا لأنظمة معالجة اللغة الطبيعية الحديثة، مما يجعل القدرة على تقييمها بدقة مهمة حيوية. نحن تصف ديسكوتس، معيار للتقييم الجوهري للكلمة العربية الجدلية. يغطي ديسكليكس خمسة لهجات عربية مهمة: جزائري، مصري، لبناني، سوري، وتونسي . في جميع هذه الدلج، يوفر ديسكيكلكس ضفافا لستة علاقات نصنية ودلالية، وهي الذكور إلى الإناث، المفرد إلى المزدوج، المفرد إلى الجمع، متنافرا، مقارنة، واثير إلى الماضي. وهكذا تتكون ديسكليك من مجموعة من أزواج الكلمات التي تمثل كل من العلاقات الست في كل من اللهجات الخمسة. لإظهار فائدة Dilex، نستخدمها لتقييم مجموعة من شركات الكلمة العربية الحالية والجديدة التي طورناها. بما يتجاوز تقييم Embeddings Word، يدعم ديسكلكلكس الجهود المبذولة لدمج اللهجات في منهج اللغة العربية. يمكن ترجمته بسهولة إلى العربية الحديثة العربية والإنجليزية، والتي يمكن أن تكون مفيدة لتقييم ترجمة Word. سيكون لدينا المعيار وكود التقييم ونماذج تضمين الكلمة الجديدة متاحة للجمهور.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا