تسأل هذه الورقة عما إذا كانت استقراء توزيع الفضاء المخفي لأمثلة النصية من فئة واحدة إلى أخرى هي تحيز حثي صالح لتعزيز البيانات.لتفعيل هذا السؤال، أقترح بروتوكول تكبير بيانات بسيط يسمى استقراء مثال جيد بما فيه الكفاية "(GE3).GE3 خفيف الوزن وليس له فرطيات.تطبق على ثلاث مجموعات بيانات تصنيف النص لمختلف سيناريوهات عدم توازن البيانات، تعمل GE3 على تحسين الأداء أكثر من عمليات التصميم وغيرها من طرق تكبير بيانات الفضاء المخفية.
This paper asks whether extrapolating the hidden space distribution of text examples from one class onto another is a valid inductive bias for data augmentation. To operationalize this question, I propose a simple data augmentation protocol called good-enough example extrapolation'' (GE3). GE3 is lightweight and has no hyperparameters. Applied to three text classification datasets for various data imbalance scenarios, GE3 improves performance more than upsampling and other hidden-space data augmentation methods.
المراجع المستخدمة
https://aclanthology.org/
تحدد هذه الورقة بعض المزالق الشائعة والمحددة في تطوير تكنولوجيات تسجيل اللغات المستهدفة في المجتمعات الصم، مع التركيز المحدد على توقيع الصور الرمزية. إنه يجعل الدعوة إلى استجواب بعض الأيديولوجيات المليسة على وجه السرعة وراء تلك التقنيات، بما في ذلك ق
التحليلات التنبؤية للرعاية الصحية الإيدز صنع القرار الطبي، تنبؤ التشخيص وتحليل مراجعة المخدرات. لذلك، دقة التنبؤ هي معايير مهمة تستلزم أيضا نماذج لغة تنبؤية قوية. ومع ذلك، فقد أثبتت النماذج باستخدام التعلم العميق عرضة للخطر تجاه حالات الإدخال المضطرب
تتطلب المهام الفرعية لتصنيف النية، مثل التواضع على تحول التوزيع، والتكيف مع مجموعات المستخدمين المعينة والتخصيص، والكشف خارج المجال، ومجموعات بيانات واسعة ومرنة للتجارب والتقييم.نظرا لأن جمع مجموعات البيانات هذه هي الوقت والمستهلك للعمل، نقترح استخدا
تصف هذه الورقة النهج الذي تم تطويره لمهمة Semeval 2021 7 (Hahackathon: دمج العوامل الديموغرافية في مهام فكاهة مشتركة) من قبل فريق Duth.استخدمنا ومقارننا مجموعة متنوعة من تقنيات المعالجة المسبقة، وأساليب Vectorization، وعديد من خوارزميات التعلم الآلات
يعرض هذا البحث طريقة دمج قاعدة بيانات مع Jgroup بالاعتماد على Hibernate
التي تمثّل إحدى أدوات مقابلة الغرض العلائقية. كما يقارن بين أداء Jgroup المدمجة
مع Hibernate و أداء RMI المدمجة مع Hibernate تظهر النتائج تفوق أداء
Jgroup/Hibernate على أداء RMI/Hibernate مع تزايد عدد الزبائن.