ترغب بنشر مسار تعليمي؟ اضغط هنا

التعلم التعريف لتصنيف مصدر البيانات غير المرئي سابقا في الفئة العاطفية غير المرئية سابقا

Meta-learning for Classifying Previously Unseen Data Source into Previously Unseen Emotional Categories

501   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نضع أنفسنا في سيناريو التصنيف الذي لا يمكن الوصول إليه الطبقات المستهدفة ونوع البيانات أثناء التدريب.نستخدم نهج التعلم التلوي لتحديد ما إذا كانت المعلومات التي تم تدريبها على التلوي من بيانات الشبكة الاجتماعية المشتركة مع ملصقات عاطفة من الرعازة يمكن أن تحقق أداء تنافسي على الرسائل المسمى بفئات العاطفة المختلفة.نستفيد القليل من اللقطة التعلم لتتناسب مع سيناريو التصنيف والنظر في التعلم التعلم القائم على التعلم المتري عن طريق إعداد الشبكات النموذجية النموذجية مع تشفير محول، مدربة في أزياء بيئية.يثبت هذا النهج فعالا لالتقاط المعلومات المعوضة من مجموعة من الوسم العاطفي المصدر للتنبؤ علامات عاطفية غير مرئية مسبقا.على الرغم من أن تحويل نوع البيانات يؤدي إلى انخفاض الأداء المتوقع، فإن نهجنا التعلم التلوي يحقق نتائج لائقة عند مقارنته بالآخر تحت الإشراف بالكامل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

مطلوبة كميات كبيرة من العمل لتنظيف مجموعات كبيرة من الكتب الرقمية لتحليل NLP، بسبب وجود أخطاء في النص الممسوح ضوئيا ووجود أحجام مكررة في كورسا. في هذه الورقة، نعتبر مسألة deCuplication في وجود أخطاء التعرف على الأحرف البصرية (OCR). نقدم طرق للتعامل م ع هذه الأخطاء، والتي تم تقييمها على مجموعة من 19347 نصية من مشاريع Gutenberg DataSet و 96،635 نصية من مكتبة Hathitrest. نوضح أن التحسينات في النماذج اللغوية الآن تمكن الآن من اكتشاف وأصحام أخطاء التعرف الضوئي على الحروف دون النظر في صورة المسح نفسه. توفر التناقضات التي عثرت عليها محاذاة أزواج من عمليات فحص نفس العمل الأساسي من نفس البيانات التدريبية لإنشاء نماذج للكشف عن الأخطاء وتصحيحها. نحدد الإصدار الكنسي لكل من الكتب 17،136 مرارا وتكرارا من الفحص من 58888 يوم. أخيرا، نحقق في طرق الكشف عن الأخطاء وتصحيحها في نصوص نسخة واحدة. نظهر أنه في المتوسط، تقوم طريقةنا بتصحيح أكثر من ستة أضعاف العديد من الأخطاء كما تقدم. كما نقدم تحليلا مثيرا للاهتمام بشأن العلاقة بين جودة المسح والعوامل الأخرى مثل الموقع والنشر.
لقد تم الاعتراف بأهمية بناء المحللين الدلاليين الذين يمكن تطبيقهم على مجالات جديدة وإنشاء برامج غير مرئية في التدريب لفترة طويلة، وقد تم الاعتراف لفترة طويلة، وتصبح مجموعات البيانات اختبار الأداء خارج النطاق متاحة بشكل متزايد. ومع ذلك، فقد تم تخصيص ا هتمام ضئيل أو معدوني لتعلم الخوارزميات أو الأهداف التي تعزز تعميم المجال، حيث تعتمد جميع الأساليب الموجودة تقريبا على التعلم المعياري الإشرافي. في هذا العمل، نستخدم إطارا للتعلم من التعريف الذي يستهدف تعميم المجال الصفرية للتحليل الدلالي. نحن نطبق خوارزمية التدريب النموذجية المرجعية التي تحاكي تحليل اللقطة الصفرية من خلال بناء القطار الافتراضي ومجموعات الاختبار من مجالات Disfoint. يستحق الهدف التعلم عن الحدس الذي يجب عليه اتخاذ خطوات التدرج التي تعمل على تحسين أداء مجال المصدر أيضا على تحسين أداء المجال المستهدف، وبالتالي تشجيع المحلل المحلل على تعميم المجالات المستهدفة غير المرئية. النتائج التجريبية على (الإنجليزية) عن مجموعات البيانات العنكبوت والصينية الصينية تظهر أن هدف التعلم التلوي يعزز بشكل كبير أداء محلل الأساس.
تحليل المعنويات الفئة في الأساس (ACSA)، والتي تهدف إلى تحديد أساور المشاعر المحبوبة من فئات الارتفاع المناقشات في مراجعات المستخدمين. ACSA صعبة ومكلفة عند إجراءها في تطبيقات عالمية حقيقية، والتي ترجع بشكل رئيسي إلى الأسباب التالية: 1.) وعلم بيانات AC SA الفاخرة غالبا ما تكون كثيفة العمالة. 2.) سيتم تحديث فئات الارتفاع بشكل ديناميكي وتعديلها بتطوير سيناريوهات التطبيق، مما يعني أن البيانات يجب أن تنعيم بشكل متكرر. 3.) نظرا لزيادة فئات الارتفاع، يجب إعادة تدريب النموذج بشكل متكرر للتكيف السريع مع بيانات فئة الجانب الإضافية حديثا. للتغلب على المشكلات المذكورة أعلاه، نقدم نهجا جديدا للتعلم من التعلم متعددة المهام (MMTL)، هذه المهام ACSA بمثابة مشكلة في التعلم التلوي (أي فيما يتعلق بمشاكل تصنيف قطباء القطبية في الفئة في الفئة مثل المهام التدريبية المختلفة لل meta - التعلم) لتعلم تهيئة مثالية وقابلة للتخصيرة نموذج التعلم متعدد المهام التي يمكن تكييفها مع مهام ACSA الجديدة بكفاءة وفعالية. تشير نتائج التجربة إلى أن النهج المقترح يتفوق بشكل كبير على النموذج الأساسي القائم على المحولات القائم على المحولات القوية مسبقا، خاصة، في حالة وجود بيانات تدريبية على غرامة أقل وصفها.
تحسنت أداء أنظمة NMT بشكل كبير في السنوات القليلة الماضية ولكن ترجمة الكلمات متعددة الإحساس لا تزال تشكل تحديا. نظرا لأن حواس الكلمات ليست ممثلة بشكل موحد في الشركة الموازية المستخدمة للتدريب، فهناك استخدام مفرط من المعنى الأكثر شيوعا في إخراج MT. في هذا العمل، نقترح CMBT (الترجمة ذات الاحتياط بالسياقة)، ​​وهو نهج لتحسين ترجمة كلمة متعددة الشعور بالاستفادة من تمثيل الكلمات السياقية المتبادلة المدربة مسبقا (CCWRS). بسبب حساسية السياق الخاصة بهم وبياناتها السابقة للتدريب الكبيرة، يمكن ل CCWRS الوصول بسهولة إلى حواس الكلمات المفقودة أو نادرة جدا في ولاية فورانيا المستخدمة لتدريب MT. على وجه التحديد، تطبق CMBT تحريض معجم ثنائي اللغة على CCWRS الجمل المستهدفة ذات المحور المنطقي من مجموعة بيانات أحادية الأحادية، ثم يترجم هذه الجمل لإنشاء كورب موازية زائفة كبيانات تدريبية إضافية لنظام MT. نحن نختبر جودة الترجمة من الكلمات الغامضة على جناح اختبار المخاط المخاطي، والتي تم بناؤها لاختبار فعالية حذف كلمة معنى الكلمة لأنظمة MT. نظهر أن نظامنا يتحسن على ترجمة حواس كلمة متعددة الترددات الصعبة والثانية.
تم اقتراح التعلم التلوي مؤخرا لتعلم النماذج والخوارزميات التي يمكن أن تعميمها من حفنة من الأمثلة.ومع ذلك، فإن تطبيقات التنبؤ الهيكلية والمهام النصية تشكل تحديات لخوارزميات التعلم التلوي.في هذه الورقة، نحن نطبق اثنين من خوارزميات التعلم التلوي، والشبك ات النموذجية والزواحف الزواحف، إلى عدد قليل من الرصاص التعرف على الكيان (NER)، بما في ذلك طريقة لإدماج نموذج اللغة قبل التدريب والحقول العشوائية الشرطية (CRF).نقترح خطة توليد المهام لتحويل مجموعات بيانات NER الكلاسيكية إلى إعداد القليل من الرصاص، لكل من التدريب والتقييم.باستخدام ثلاث مجموعات بيانات عامة، نظهر أن خوارزميات التعلم التلوي هذه تفوق خطاس بخبراء ذو صقل معقول.بالإضافة إلى ذلك، نقترح مزيجا جديدا من الشبكات النموذجية والزواحف.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا