ترغب بنشر مسار تعليمي؟ اضغط هنا

الهجوم الشدائي الرمادي والدفاع عن تصنيف المعنويات

Grey-box Adversarial Attack And Defence For Sentiment Classification

366   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نحن نقدم هجودا عدديا رمادي مربع وإطار الدفاع لتصنيف المعنويات.نحن نتطلع إلى قضايا التفاويذ والحفاظ على التسمية وإعادة إعمار المدخلات للهجوم والدفاع في إطار واحد موحد.تظهر نتائجنا أنه بمجرد تدريبها مرة واحدة، فإن نموذج المهاجمة قادر على توليد أمثلة خصومة عالية الجودة بشكل أسرع (أمر واحد من الحجم أقل في الوقت المناسب) من أساليب المهاجمة الحديثة.هذه الأمثلة أيضا الحفاظ على المشاعر الأصلية وفقا للتقييم البشري.بالإضافة إلى ذلك، ينتج إطارنا مصنف محسن قوي في الدفاع عن طرق مهاجمة متعددة الخصومة.رمز متاح في: https://github.com/ibm-aur-nlp/v-def-text-dist.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تجذب تصنيف المعنويات والكشف عن السخرية الكثير من الاهتمام من قبل مجتمع البحوث NLP. ومع ذلك، فإن حل هاتين المشكلتين باللغة العربية وعلى أساس بيانات الشبكة الاجتماعية (I.E.، Twitter) لا يزال مصلحة أقل. في هذه الورقة نقدم حلولا مخصصة لتصنيف المعنويات وم هام الكشف عن السخرية التي تم تقديمها كجزء من مهمة مشتركة من قبل أبو فرحة وآخرون. (2021). نقوم بضبط نماذج المحولات الحالية المحولات الحالية لاحتياجاتنا. بالإضافة إلى ذلك، نستخدم مجموعة متنوعة من تقنيات التعلم الآلي مثل أخذ العينات الأولية والتكبير والتعبئة والتغليف واستخدام ميزات META لتحسين أداء النماذج. نحن نحقق درجة F1 من 0.75 على مشكلة تصنيف المعنويات حيث يتم حساب درجة F1 على الفصول الإيجابية والسلبية (لا يتم أخذ الفصل المحايد في الاعتبار). نحن نحقق درجة F1 من 0.66 فوق مشكلة الكشف عن السخرية حيث يتم حساب درجة F1 عبر الفئة الساخرة فقط. في كلتا الحالتين، يتم تقييم النتائج المذكورة أعلاه على Arsarcasm-V2 - مجموعة بيانات ممتدة من Arsarcasm (Farha و Magdy، 2020) تم تقديمها كجزء من المهمة المشتركة. هذا يعكس تحسنا لتحقيق أحدث النتائج في كلتا المهام.
يهدف تصنيف المعنويات على مستوى الجانب (ALSC) إلى تحديد قطبية المعنويات من جانب محدد في جملة. ESSC عبارة عن إعداد عملي في تحليل المعنويات المستندة إلى جانب الجسيم بسبب عدم وجود مصطلح الرأي اللازم، لكنه فشل في تفسير سبب اشتقاق قطبية المعنويات للجانب. ل معالجة هذه المشكلة، تعمل الأعمال الحديثة من تشفير المحولات التي تم تدريبها مسبقا على ELSC لاستخراج شجرة التبعية التي تركز على جانب جانب الجوانب التي يمكن أن تحدد كلمات الرأي. ومع ذلك، فإن كلمات الرأي المستحثة توفر فقط جديلة بديهية أقل بكثير من الترجمة الترجمة الشاملة على مستوى الإنسان. بالإضافة إلى ذلك، يميل التشفير المدرب مسبقا إلى استيعاب المشاعر الجوهرية في الجانب، مما تسبب في تحيز المعنويات وبالتالي يؤثر على أداء النموذج. في هذه الورقة، نقترح إطارا لتعليم تمثيل جانبي لمكافحة التحيز. يزيل أولا تحيز المعنويات في الجانب التضمين من خلال التعلم الخصم ضد المعنويات السابقة للجوانب. بعد ذلك، تقوم بمحاطة مرشحي الرأي المقطرين بالجانب من خلال نمذجة التبعية المستندة إلى SPAN لتسليط الضوء على شروط الرأي القابلة للتفسير. إن طريقتنا تحقق أداء جديد لحساب الفن في خمسة معايير، مع إمكانية استخراج الرأي غير المزعوم.
حقق نهج تكبير البيانات والضيقات الخصم مؤخرا نتائج واعدة في حل المشكلة المفرطة في العديد من مهام معالجة اللغة الطبيعية (NLP) بما في ذلك تصنيف المعنويات. ومع ذلك، فإن الدراسات الحالية التي تهدف إلى تحسين قدرة التعميم من خلال زيادة البيانات التدريبية مع أمثلة مرادفة أو إضافة ضوضاء عشوائية إلى Adgeddings Word، والتي لا يمكنها معالجة مشكلة الرابطة الزائفة. في هذا العمل، نقترح إطارا لتعزيز التعزيز نهاية إلى نهاية، والذي ينفذ بشكل مشترك توليد بيانات مضادة وتصنيف المعنويات المزدوجة. نهجنا لديه ثلاث خصائص: 1) يولد المولد تلقائيا جمل هائلة ومتنوعة؛ 2) يحتوي التمييز على مؤشر للمشاعر الجانبية الأصلية ومؤشر المعنويات الجانبية الناضجة، والذي يقوم بتقييم جودة العينة الناتجة بشكل مشترك ومساعدة المولد على توليد عينات مجفوف عالية الجودة أعلى جودة؛ 3) يتم استخدام التمييز مباشرة كقسم المعنويات النهائية دون الحاجة إلى بناء واحد إضافي. تظهر تجارب واسعة أن نهجنا يتفوق على خطوط خطوط خطوط تكبير البيانات قوية على العديد من مجموعات بيانات تصنيف المعفاة القياسية. يؤكد إجراء مزيد من التحليل بمزايا نهجنا في توليد عينات تدريب أكثر تنوعا وحل مشكلة الرابطة الزائفة في تصنيف المعنويات.
توفر منصة خدمة البث مثل YouTube وظيفة مناقشة للجماهير في جميع أنحاء العالم لمشاركة التعليقات. YouTubers الذين يقومون بتحميل مقاطع الفيديو على منصة YouTube ترغب في تتبع أداء مقاطع الفيديو التي تم تحميلها. ومع ذلك، فإن مهام التحليل الحالية من YouTube ت وفر فقط بعض مؤشرات الأداء مثل متوسط ​​مدة العرض، سجل التصفح، والتباين في التركيبة السكانية للجمهور، وما إلى ذلك، ونقص تحليل المعنويات بشأن تعليقات الجمهور. لذلك، تقترح الورقة مؤشرات المعنويات متعددة الأبعاد مثل تفضيلات YouTuber وتفضيلات الفيديو ومستوى الإثارة لالتقاط مشاعر شاملة بشأن تعليقات الجمهور لمقاطع الفيديو ويوتيوغتر. لتقييم أداء الطبقات المختلفة، نقوم بتجربة معصوص قائما على التعلم والتعلم ومقرها في التعلم، ويكتشف تلقائيا ثلاثة مؤشرات معنويات لتصريحات الجمهور. تشير النتائج التجريبية إلى أن المصنف المستند إلى BERT يعد نموذج تصنيف أفضل من الطبقات الأخرى وفقا لنتيجة F1، ومؤشر المعنويات على مستوى الإثارة هو تحسن تماما. لذلك، يمكن حل مهام الكشف عن المعنويات المتعددة على منصة خدمة تدفق الفيديو من خلال مؤشرات المعنويات متعددة الأبعاد المقترحة مصحوبة مع مصنف Bert للحصول على أفضل نتيجة.
لقد قطع تحليل المعنويات شوطا طويلا لغات الموارد عالية الوزن بسبب توافر كورسا مشروح كبير.ومع ذلك، فإنه لا يزال يعاني من عدم وجود بيانات تدريب لغات الموارد المنخفضة.لمعالجة هذه المشكلة، نقترح شبكة الخصومة باللغة الشرطية (العشيرة)، وهي عبارة عن مبنى عصب ي نهاية إلى نهائي لتحليل المشاعر المتبادلة دون إشراف عبر اللغات.تختلف العشيرة عن العمل المسبق في ذلك، حيث يسمح للتدريب الخصم بتصدر على كل من الميزات المستفادة وتنبؤ المعنويات، لزيادة التمييزي للتمثيل المستفاد في الإعداد المتبادل.تظهر النتائج التجريبية أن العشيرة تفوقت على الطرق السابقة في مجموعة بيانات مراجعة الأمازون متعددة المجالات متعددة اللغات.يتم إصدار شفرة المصدر لدينا في https://github.com/hemanthkandula/clan.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا