الإعلان عن التجارة الإلكترونية ومواقع وسائل التواصل الاجتماعي تقدم انطباعات إعلانية على نطاق الويب بقيمة قيادة يومية لكل من المتسوقين والمعلنين.يتطلب هذا المقياس طرقا برنامجية للكشف عن محتوى غير مناسب في الإعلانات لحماية تجربة العملاء والثقة.يركز هذه الورق على تقنيات تدريب نماذج تصنيف النص بموجب قيود الموارد، بنيت كجزء من الحلول الآلية للاعتدال محتوى الإعلان.نظير على مدى ضعف الإشراف، يمكن تطبيق تعلم المناهج الدراسية والتدريب متعدد اللغات بفعالية على Tune-Tune Bert ومتغيراته لمهام تصنيف النص بالاقتران مع مختلف استراتيجيات تكبير البيانات.تبين تجاربنا الواسعة لغات متعددة أن هذه التقنيات تكتشف فئات الإعلانات العدائية مع مكاسب كبيرة في الدقة في عتبة استدعاء عالية فوق الأساس.
Advertising on e-commerce and social media sites deliver ad impressions at web scale on a daily basis driving value to both shoppers and advertisers. This scale necessitates programmatic ways of detecting unsuitable content in ads to safeguard customer experience and trust. This paper focusses on techniques for training text classification models under resource constraints, built as part of automated solutions for advertising content moderation. We show how weak supervision, curriculum learning and multi-lingual training can be applied effectively to fine-tune BERT and its variants for text classification tasks in conjunction with different data augmentation strategies. Our extensive experiments on multiple languages show that these techniques detect adversarial ad categories with a substantial gain in precision at high recall threshold over the baseline.
المراجع المستخدمة
https://aclanthology.org/
يشكل التعميم الشامل مسألة مهمة للكشف عن الموقف (SD).في هذه الورقة القصيرة، نقوم بالتحقيق في SD الصلبة العدسة، حيث يتم الاستفادة من المعرفة من البيانات التي تم إنشاؤها من قبل المستخدم لتحسين الأخبار SD على أهداف غير مرئية أثناء التدريب.نقوم بتنفيذ شبك
أصبحت نماذج لغة كبيرة من الصعب تدريبا على نحو متزايد بسبب وقت الحسبان المتزايد والتكلفة.في هذا العمل، نقدم SRU ++، وهي عبارة عن بنية عالية الكفاءة تجمع بين تكرار سريع واهتمام لنمذجة التسلسل.SRU ++ يعرض قدرة النمذجة القوية وكفاءة التدريب.فيما يتعلق بم
يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة
مشكلة الكشف عن الإجهاد النفسي في الوظائف عبر الإنترنت، وعلى نطاق أوسع، من اكتشاف الناس في محنة أو في حاجة إلى مساعدة، هو تطبيق حساس له القدرة على تفسير النماذج أمر حيوي.هنا، نقدم العمل في استكشاف استخدام مهمة ذات صلة من الناحية الدلوية، والكشف عن الم
نقدم خوارزمية تدريبية مستهدفة بسيطة ولكنها فعالة (TAT) لتحسين التدريب الخصم لفهم اللغة الطبيعية.الفكرة الرئيسية هي أن تخطئ الأخطاء الحالية وتحديد أولويات التدريب على الخطوات إلى حيث يخطئ النموذج أكثر.تظهر التجارب أن TAT يمكن أن تحسن بشكل كبير الدقة ع