ترغب بنشر مسار تعليمي؟ اضغط هنا

Toxccin: تصنيف المحتوى السام مع الترجمة الشفوية

ToxCCIn: Toxic Content Classification with Interpretability

280   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

على الرغم من النجاحات الأخيرة للنماذج المحول القائمة على المحولات من حيث الفعالية في مجموعة متنوعة من المهام، غالبا ما تظل قراراتها مبهمة للبشر.تعتبر التفسيرات مهمة بشكل خاص للمهام مثل اللغة الهجومية أو الكشف عن السمية على وسائل التواصل الاجتماعي لأن عملية الاستئناف اليدوية غالبا ما تكون في مكانها للتنازل عن المحتوى الموضح تلقائيا.في هذا العمل، نقترح تقنية لتحسين إمكانية تفسير هذه النماذج، بناء على افتراض بسيط وقوي: منشور على الأقل سميك مثل أكثر سبتمته سامة.نحن ندمج هذا الافتراض في نماذج المحولات من خلال تسجيل وظيفة بناء على الحد الأقصى للسمية من يمتد ويزيد عملية التدريب لتحديد المواقف الصحيحة.نجد هذا النهج فعال ويمكننا إنتاج تفسيرات تتجاوز جودة تلك المنصوص عليها في تحليل الانحدار اللوجستي (غالبا ما تعتبر نموذجا واضحا للغاية)، وفقا لدراسة بشرية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نركز على نوع من المنطق الرسمي اللغوي حيث يكون الهدف هو السبب في معرفة واضحة في شكل حقائق وقواعد لغوية طبيعية (كلارك وآخرون، 2020). يعمل عمل مؤخرا، يدعى Prover (Saha et al.، 2020)، من المنطق من خلال الإجابة على سؤال ويولد أيضا رسم بياني إثبات يشرح الجواب. ومع ذلك، فإن المنطق التركيبي ليس فريدا دائما وقد يكون هناك طرق متعددة للتوصل إلى الإجابة الصحيحة. وهكذا، في عملنا، نتعامل مع مشكلة جديدة وصعبة لتوليد رسوم بيانية إثبات متعددة للمناسبة في قواعد قواعد اللغة الطبيعية. يوفر كل دليل على الأساس المنطقي مختلف للإجابة، وبالتالي تحسين إمكانية تفسير أنظمة المنطق هذه. من أجل التعلم المشترك من جميع الرسوم البيانية المقررة واستغلال الارتباط بين البراهين المتعددة لسؤال، نطرح هذه المهمة كمشكلة توليد محددة على مساحات الإخراج المنظمة حيث يتم تمثيل كل دليل كشركة بيانية موجهة. نقترح اثنين من المتغيرات لطراز جيل مجموعة دليل، Multiprover. ينشئ النموذج الأول لدينا، Multilabel-multiprover، مجموعة من البراهين عبر تصنيف العلامات المتعددة والتكييف الضمني بين البراهين؛ في حين أن النموذج الثاني، Multrive-multriver، يولد دليلا بشكل مثالي من خلال تكييف صريح على البراهين التي تم إنشاؤها مسبقا. تكشف التجارب على مجموعات البيانات الاصطناعية الصفرية، والصفرية، وإشعال مجموعات البيانات، أن كلا من طرازات Multiprover Upperform بشكل كبير تفوق Prover على مجموعات البيانات التي تحتوي على برائق ذهبية متعددة. يحصل Merriative-MultiProver على أحدث دليل على السيناريوهات التي تتميز بالرصاص حيث تحتوي جميع الأمثلة على براهين صحيحة واحدة. كما تعمم بشكل أفضل للأسئلة التي تتطلب أعماق أعلى من التفكير حيث تكون البراهين المتعددة أكثر تواترا.
نبلغ عن تقديمنا إلى المهمة 1 من تحدي جيرفال 2021 - تصنيف التعليق السام.نحقق في طرق مختلفة لتعزيز البيانات التدريبية النادرة لتحسين الأداء النموذجي خارج الرف على مهمة تصنيف سامة للتعليق.للمساعدة في معالجة قيود مجموعة بيانات صغيرة، نستخدم البيانات التي تم إنشاؤها مزخرف بواسطة نموذج GPT-2 الألماني.إن استخدام البيانات الاصطناعية لم تقلع مؤخرا كحل محتمل لبيانات التدريب التدريجي في مجال التصديق في NLP، والنتائج الأولية تعد.ومع ذلك، لم ير نموذجنا تحسنا قياسيا من خلال استخدام البيانات الاصطناعية.نناقش أسباب محتملة لهذا الاكتشاف واستكشاف الأعمال المستقبلية في هذا المجال.
تم اعتماد اهتمام الذات مؤخرا لمجموعة واسعة من مشاكل النمذجة التسلسلية. على الرغم من فعاليته، فإن اهتمام الذات يعاني من حساب التربيعي ومتطلبات الذاكرة فيما يتعلق بطول التسلسل. تركز النهج الناجحة للحد من هذا التعقيد على حضور النوافذ المنزلق المحلية أو مجموعة صغيرة من المواقع مستقلة عن المحتوى. يقترح عملنا تعلم أنماط الانتباه ديناميكية متناثرة تتجنب تخصيص الحساب والذاكرة لحضور المحتوى غير المرتبط باستعلام الفائدة. يبني هذا العمل على سطرين من الأبحاث: فهو يجمع بين مرونة النمذجة للعمل المسبق على اهتمام متمرد للمحتوى مع مكاسب الكفاءة من الأساليب القائمة على الاهتمام المحلي والزموني المتناثر. نموذجنا، محول التوجيه، ينفذ عن النفس مع وحدة توجيه متناثرة تعتمد على الوسائل K عبر الإنترنت مع تقليل التعقيد العام للانتباه إلى O (N1.5D) من O (N2D) لطول التسلسل N وبعد المخفي D. نظرا لأن نموذجنا يتفوق على نماذج انتباه متناثرة قابلة للمقارنة على نمذجة اللغة على Wikitext-103 (15.8 مقابل 18.3 حيرة)، وكذلك على جيل الصورة على Imagenet-64 (3.43 مقابل 3.44 بت / خافت) أثناء استخدام طبقات أقل من الاهتمام الذاتي. بالإضافة إلى ذلك، وضعنا مجموعة جديدة من مجموعة جديدة من مجموعة بيانات PG-19 التي تم إصدارها حديثا، والحصول على اختبار حيرة من 33.2 مع نموذج محول توجيه 22 طبقة مدرب على تسلسل الطول 8192. نحن نفتح المصدر لتحويل التوجيه في Tensorflow.1
يتطلب بناء نماذج لمهام اللغة الطبيعية الواقعية التعامل مع النصوص الطويلة والمحاسبة التبعيات الهيكلية المعقدة.ظهرت تمثيلات رمزية عصبية كوسيلة للجمع بين قدرات التفكير في الأساليب الرمزية، مع تعبير الشبكات العصبية.ومع ذلك، فقد صممت معظم الأطر الموجودة ل لجمع بين التمثيل العصبي والرمزي لمهام التعلم العلائقية الكلاسيكية التي تعمل على الكون من الكيانات والعلاقات الرمزية.في هذه الورقة، نقدم دراسنا، وهو إطار إعلاني مفتوح المصدر لتحديد النماذج العلائقية العميقة، مصممة لدعم مجموعة متنوعة من سيناريوهات NLP.يدعم إطارنا سهلا التكامل مع تشفير اللغة التعبيرية، ويوفر واجهة لدراسة التفاعلات بين التمثيل والاستدلالية والتعلم.
تأخذ مهمة نقل النمط (النمط هنا بمعنى "هنا" مع العديد من الجوانب بما في ذلك التسجيل، وهيكل الجملة، واختيار المفردات) إجراء إدخال النص وإعادة كتابةها في نمط مستهدف محدد يحافظ على المعنى، ولكن تغيير نمط نص المصدر لمطابقة ذلك من الهدف. يعتمد الكثير من ال أبحاث الموجودة في هذه المهمة على استخدام مجموعات البيانات المتوازية. في هذا العمل، نوظف نتائج مؤخرا في نمذجة اللغة المتقاطعة غير المتبادلة (XLM) والترجمة الآلية لنقل النمط أثناء التعامل مع بيانات الإدخال كما غير إجمالي. أولا، نوضح أن إضافة تضمين المحتوى "" إلى XLM والتي تلتقط مجموعة الموضوعات المحددة للإنسان يمكن أن تحسن الأداء على الطراز الأساسي. غالبا ما تعتمد تقييم نقل النمط على المقاييس المصممة للترجمة الآلية التي تلقت انتقاد مدى ملاءمتها لهذه المهمة. كمساهمة ثانية، نقترح استخدام مجموعة من الأنماط الكلاسيكية ككمل مفيد للتقييم. نقوم باختيار بعض هذه التدابير وتشمل هذه في تحليل نتائجنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا