ترغب بنشر مسار تعليمي؟ اضغط هنا

نماذج لغة التدريب تحت قيود الموارد للكشف عن المعددي

Training Language Models under Resource Constraints for Adversarial Advertisement Detection

413   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الإعلان عن التجارة الإلكترونية ومواقع وسائل التواصل الاجتماعي تقدم انطباعات إعلانية على نطاق الويب بقيمة قيادة يومية لكل من المتسوقين والمعلنين.يتطلب هذا المقياس طرقا برنامجية للكشف عن محتوى غير مناسب في الإعلانات لحماية تجربة العملاء والثقة.يركز هذه الورق على تقنيات تدريب نماذج تصنيف النص بموجب قيود الموارد، بنيت كجزء من الحلول الآلية للاعتدال محتوى الإعلان.نظير على مدى ضعف الإشراف، يمكن تطبيق تعلم المناهج الدراسية والتدريب متعدد اللغات بفعالية على Tune-Tune Bert ومتغيراته لمهام تصنيف النص بالاقتران مع مختلف استراتيجيات تكبير البيانات.تبين تجاربنا الواسعة لغات متعددة أن هذه التقنيات تكتشف فئات الإعلانات العدائية مع مكاسب كبيرة في الدقة في عتبة استدعاء عالية فوق الأساس.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يشكل التعميم الشامل مسألة مهمة للكشف عن الموقف (SD).في هذه الورقة القصيرة، نقوم بالتحقيق في SD الصلبة العدسة، حيث يتم الاستفادة من المعرفة من البيانات التي تم إنشاؤها من قبل المستخدم لتحسين الأخبار SD على أهداف غير مرئية أثناء التدريب.نقوم بتنفيذ شبك ة مخدرة قائمة على Bert وتظهر تحسينات الأداء التجريبية على مجموعة من خطوط الأساس القوية.بالنظر إلى وفرة البيانات التي تم إنشاؤها من قبل المستخدم، والتي تكون أقل تكلفة بكثير لاسترداد وتعليقها من المقالات الإخبارية، فإن هذا يشكل اتجاها بحثا واعدا.
أصبحت نماذج لغة كبيرة من الصعب تدريبا على نحو متزايد بسبب وقت الحسبان المتزايد والتكلفة.في هذا العمل، نقدم SRU ++، وهي عبارة عن بنية عالية الكفاءة تجمع بين تكرار سريع واهتمام لنمذجة التسلسل.SRU ++ يعرض قدرة النمذجة القوية وكفاءة التدريب.فيما يتعلق بم هام نمذجة اللغة القياسية مثل مجموعات بيانات ENWIK8 و Wiki-103 و Mount Word Word، يحصل نموذجنا على أجزاء أفضل لكل حرف وحيرة أثناء استخدام تكلفة التدريب الأقل بنسبة 3x-10x مقارنة بنماذج المحولات ذات الأداء الأعلى.على سبيل المثال، يحقق نموذجنا نتيجة حديثة لمجموعة بيانات Enwik8 باستخدام 1.6 أيام من التدريب على آلة 8 GPU.نوضح كذلك أن SRU ++ يتطلب الحد الأدنى من الاهتمام بالقرب من الأداء القريب من الحديث.تشير نتائجنا إلى الاستفادة بشكل مشترك تكرار سريع مع القليل من الاهتمام باعتباره اتجاها واعدا لتسريع التدريب النموذجي والاستدلال.
يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة للعديد من مهام NLP، بما في ذلك اكتشاف الموقف.في هذه الورقة، نقترح طريقة رواية متناصة قائمة بذاتها تعزز نموذج اللغة الملثم للكشف عن الموقف.بدلا من إخفاء الرمز المميز العشوائي، نقترح استخدام نسبة مرجحة للأحكام المرجحة لتحديد الكلمات ذات الموقف العالي ومن ثم نموذج آلية الاهتمام التي تركز على هذه الكلمات.نظهر أن نهجنا المقترح يتفوق على حالة الفنية من أجل الكشف عن البيانات حول بيانات تويتر حول الانتخابات الرئاسية الأمريكية 2020.
مشكلة الكشف عن الإجهاد النفسي في الوظائف عبر الإنترنت، وعلى نطاق أوسع، من اكتشاف الناس في محنة أو في حاجة إلى مساعدة، هو تطبيق حساس له القدرة على تفسير النماذج أمر حيوي.هنا، نقدم العمل في استكشاف استخدام مهمة ذات صلة من الناحية الدلوية، والكشف عن الم شاعر، من أجل الكشف عن الإجهاد النفسي غير المختص به بنفس القدر ولكن أكثر قابلية للتفسير ومقارنة مع نموذج الصندوق الأسود.على وجه الخصوص، نستكشف استخدام التعلم متعدد المهام وكذلك طراز اللغة القائمة على العاطفة.مع نماذجنا المخفوعة العاطفة، نرى نتائج مماثلة لتحقيق أحدث بيرت.تبين تحليلنا للكلمات المستخدمة للتنبؤ أن نماذجنا المشنقة لدينا مرآة مكونات نفسية من الإجهاد.
نقدم خوارزمية تدريبية مستهدفة بسيطة ولكنها فعالة (TAT) لتحسين التدريب الخصم لفهم اللغة الطبيعية.الفكرة الرئيسية هي أن تخطئ الأخطاء الحالية وتحديد أولويات التدريب على الخطوات إلى حيث يخطئ النموذج أكثر.تظهر التجارب أن TAT يمكن أن تحسن بشكل كبير الدقة ع لى التدريب الخصم القياسي على الغراء وتحقيق نتائج جديدة من أحدث النتائج في XNLI.سيتم إصدار شفرة لدينا عند قبول الورقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا