ترغب بنشر مسار تعليمي؟ اضغط هنا

نتعامل مع مشكلة شبكات التدريب الذاتي ل NLU في بيئة الموارد المنخفضة --- عدد قليل من البيانات المسمى والكثير من البيانات غير المسماة. إن فعالية التدريب الذاتي هي نتيجة لزيادة مقدار البيانات التدريبية أثناء التدريب. ومع ذلك، يصبح أقل فعالية في إعدادات الموارد المنخفضة بسبب الملصقات غير الموثوقة المتوقعة بواسطة نموذج المعلم على البيانات غير المسبقة. تم استخدام قواعد القواعد، التي تصف الهيكل النحوي للبيانات، في NLU للحصول على شرح أفضل. نقترح استخدام قواعد القواعد في التدريب الذاتي كآلية وضع العلامات الزائفة أكثر موثوقية، خاصة عندما يكون هناك عدد قليل من البيانات المسمى. نقوم بتصميم خوارزمية فعالة تقوم ببناء وتوسيع قواعد قواعد اللغة دون تورط بشري. ثم ندمج القواعد المبنية كآلية وضع العلامات الزائفة في التدريب الذاتي. هناك سيناريوهات محتملة فيما يتعلق بتوزيع البيانات: غير معروف أو معروف في التدريب قبل التدريب. إننا نوضح تجريبيا أن نهجنا يتفوق بشكل كبير على الأساليب الحديثة في ثلاث مجموعات بيانات معيار لكل من السيناريوهات.
يركز تحليل المعنويات المستندة إلى جانب جوانب (ABASA) عادة على استخراج الجوانب والتنبؤ بمشاعرهم على جمل فردية مثل مراجعات العملاء. في الآونة الأخيرة، تلقت منصة أخرى من برنامج تقاسم الرأي، وهي منتدى الإجابة على السؤال (QA)، شعبية متزايدة، التي تتراكم ع دد كبير من آراء المستخدم تجاه الجوانب المختلفة. هذا يحفزنا على التحقيق في مهمة ABASA على منتديات ضمان الجودة (ABASA-QA)، تهدف إلى الكشف بشكل مشترك بين الجوانب التي تمت مناقشتها وأسطابات المشاعر الخاصة بهم لفترة من ضمان الجودة. على عكس جمل المراجعة، يتكون زوج ضمان الجودة من جملتين موازيتين، مما يتطلب نمذجة التفاعل لمحاذاة الجانب المذكور في السؤال وأدائن الرأي المرتبط في الإجابة. تحقيقا لهذه الغاية، نقترح نموذجا بتصميم محدد للنمذجة المتعلقة بالتفاعل عن الجوانب عبر الجملة لمعالجة هذه المهمة. يتم تقييم الطريقة المقترحة على ثلاثة مجموعات بيانات حقيقية، وتظهرت النتائج أن نموذجنا يفوق على العديد من خطوط الأساس القوية المعتمدة من النماذج الحكومية ذات الصلة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا