Bootstraping مصنف الإعلانات السياقية المحبوس على نطاق واسع من ويكيبيديا


الملخص بالعربية

يوفر الإعلان السياقي للمعلنين الفرصة لاستهداف السياق الأكثر صلة بإعلاناتهم. يجعل مجموعة متنوعة كبيرة من الموضوعات المحتملة تحديا للغاية لجمع وثائق التدريب لبناء نموذج تصنيف إشراف أو يؤلف قواعد مكتوبة للخبراء في نظام تصنيف قائم على القواعد. علاوة على ذلك، في التصنيف الفائق الحبيبات، غالبا ما تتداخل فئات مختلفة أو تعايشها، مما يجعل من الصعب تصنيفها بدقة. في هذا العمل، نقترح Wiki2CAT، وهي طريقة لمعالجة تصنيف نصي كبير الحجم من خلال النقر على الرسم البياني للفئة Wikipedia. يتم تعيين الفئات في تصنيف IAB أولا إلى فئة العقد في الرسم البياني. ثم يتم نشر الملصق عبر الرسم البياني للحصول على قائمة بمستندات Wikipedia المسمى للحث على نصوص النصوص. تعد الطريقة مثالية لمشاكل التصنيف واسعة النطاق لأنها لا تتطلب أي مستند يدويا أو قواعد يدويا أو كلمات أساسية. يتم قياس الطريقة المقترحة مع مختلف خطوط الأساس القائمة على التعلم والكلمات الرئيسية وتجسد أداء تنافسي على مجموعات البيانات المتوفرة للجمهور ومجموعة بيانات جديدة تحتوي على أكثر من 300 فئة واحدة من الفئات الجميلة.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث