ترغب بنشر مسار تعليمي؟ اضغط هنا

إعادة تضمين عينات صعبة عبر المعلومات المتبادلة مقيدة زيادة في زيادة الممتلكات

Re-embedding Difficult Samples via Mutual Information Constrained Semantically Oversampling for Imbalanced Text Classification

661   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

عادة ما يتم تصريف عينات صعبة من فئة الأقليات في تصنيف النص غير المتوازنين لأنها مضمنة في منطقة دلالية متداخلة مع فئة الأغلبية. في هذه الورقة، نقترح معلومات متبادلة إطار متبادل إطار عمل إطفاء دلالة (MISO) يمكن أن تولد مثيلات مرساة لمساعدة شبكة العمود الفقري على تحديد موضع إعادة تضمين التمثيل غير المتداخلة لكل عينة صعبة لكل عينة صعبة. يتكون ميسو من (1) وحدة دموية دلالية تتعلم دلالات متشابكة بين العينات الصعبة والأغلبية مع آلية اهتمام متعدد الأهمية التكيفية، (2) فقدان المعلومات المتبادلة التي تفرض نموذجنا لتعلم تمثيلات جديدة من دلالات متشابكة في غير منطقة متداخلة من فئة الأقليات، و (3) فك تشفير المشفر المقدم من الأقميات التي تتلألؤها التي تتلألؤها الدلالية التي تثبت أن تظل ترتباطاتها مع فئة الأقليات، ثم باستخدام هذه التمثيلات الدلالية في الإعفاء من أجل توليد مثيلات مرساة لكل عينة صعبة. تظهر التجارب في مجموعة متنوعة من مهام تصنيف النص غير المتوازنة أن مثيلات المرساة تساعد المصنفين على تحقيق تحسينات كبيرة على خطوط خطوط خطوط خطوط خطوط طويلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لقد ظهر التعلم الناقض كطريقة لتعلم التمثيل القوي ويسهل العديد من المهام المصب المختلفة خاصة عندما تكون البيانات الخاضعة للإشراف محدودة. كيفية بناء عينات مضاءة فعالة من خلال تكبير البيانات هي مفتاح نجاحها. على عكس مهام الرؤية، لم يتم التحقيق في طريقة تكبير البيانات للتعلم المتعاقل بما فيه الكفاية في مهام اللغة. في هذه الورقة، نقترح نهج رواية لبناء عينات صغيرة لمهام اللغة باستخدام تلخيص النص. نحن نستخدم هذه العينات للتعلم المتعاقل الخاضع للإشراف للحصول على تمثيلات نصية أفضل التي تنفصل إلى حد كبير مهام تصنيف النص بشراحي محدود. لمزيد من تحسين الطريقة، نخلط عينات من فئات مختلفة وإضافة تنظيم إضافي، يدعى Mixsum، بالإضافة إلى فقدان الانتروبيا. توضح التجارب في مجموعات بيانات تصنيف النص العالمي الحقيقي (Amazon-5، YELP-5، AG News، IMDB) فعالية إطار التعلم المقاوم للضبط المقترح مع تكبير البيانات القائمة على التلخصات وانتظام Mixsum.
يحتوي نموذج HIAGM النموذجي الحالي على تصنيف النص التسلسل الهرمي وجود قيودان. أولا، يربط كل نموذج نصي مع جميع الملصقات في DataSet التي تحتوي على معلومات غير ذات صلة. ثانيا، لا ينظر في أي عائق إحصائي على تمثيلات التسمية المستفادة من تشفير الهيكل، في حي ن ثبت أن القيود المفروضة على تعلم التمثيل أنها مفيدة في العمل السابق. في هذه الورقة، نقترح HTCINFOMAX لمعالجة هذه المشكلات عن طريق إدخال تعظيم المعلومات التي تتضمن وحدتي: تعظيم المعلومات المتبادلة النصية وتسمية التسمية مطابقة مسبقة. الوحدة النمطية الأولى يمكن أن تصمم التفاعل بين كل نموذج نصية وتسميات الحقيقة الأرضية صراحة التي تتصفح المعلومات غير ذات الصلة. والثاني يشجع تشفير الهيكل على تعلم تمثيلات أفضل مع الخصائص المرجوة لجميع الملصقات التي يمكن أن تتعامل بشكل أفضل مع عدم توازن العلامة في تصنيف النص الهرمي. النتائج التجريبية على اثنين من مجموعات البيانات القياسية توضح فعالية HTCINFOMAX المقترحة.
مستوحاة من اختيار ميزة المعلومات المتبادلة (MI) في الانحدار اللوجستي، في هذه الورقة، نقترح تشذيب الطبقة المستندة إلى MI: لكل طبقة من الشبكة العصبية متعددة الطبقات، الخلايا العصبية ذات القيم العالية في MI فيما يتعلق يتم الحفاظ على الخلايا العصبية المح فوظة في الطبقة العليا. بدءا من أعلى طبقة SoftMax، تتقلص الطبقة الحكيمة في الأزياء من أعلى إلى أسفل حتى تصل إلى طبقة تضمين الكلمة السفلي. تقدم استراتيجية التذكير المقترحة مزايا تقنيات تشذيب الوزن: (1) يتجنب الوصول إلى الذاكرة غير النظامية لأن التمثيلات والمصفوفات يمكن الضغط عليها في نظرائها الأصغر ولكن الكثيف، مما يؤدي إلى زيادة السرعة؛ (2) بطريقة تشذيب من أعلى إلى أسفل، تعمل الطريقة المقترحة من منظور عالمي أكثر استنادا إلى إشارات تدريبية في الطبقة العليا، والحكومة كل طبقة من خلال نشر تأثير الإشارات العالمية من خلال الطبقات، مما يؤدي إلى أداء أفضل في نفس مستوى Sparsity. تظهر تجارب واسعة أنه على مستوى Sparsity نفسه، فإن الاستراتيجية المقترحة تقدم كل من التطورات العالية والأداء أعلى من طرق تشذيب الوزن (على سبيل المثال، تشذيب الحجم، تقليم الحركة).
في السنوات الأخيرة، الأعمال التجارية العالمية في المناقشات عبر الإنترنت وتقاسم الرأي حول وسائل التواصل الاجتماعي مزدهرة. وبالتالي، يقترح ذلك مهمة التنبؤ بإعادة الدخول لمساعدة الناس على تتبع المناقشات التي يرغبون في الاستمرار فيها. ومع ذلك، فإن الأعما ل الحالية تركز فقط على استغلال سجلات الدردشة ومعلومات السياق، وتجاهل إشارات التعلم المفيدة المحتملة بيانات المحادثة الأساسية، مثل أنماط موضوع المحادثة والمشاركة المتكررة للمستخدمين المستهدفين، والتي تساعد على فهم سلوك المستخدمين المستهدفين بشكل أفضل في المحادثات. في هذه الورقة، نقترح ثلاثة مهام مساعدة مثيرة للاهتمام وأسس بشكل جيد، وهي نمط انتشار، المستخدم المستهدف المتكرر، وتحويل التأتجل، كإشارات الإشراف ذاتيا لإعادة التنبؤ بالدخول. يتم تدريب هذه المهام الإضافية مع المهمة الرئيسية بطريقة متعددة المهام. تظهر النتائج التجريبية على مجموعة بيانات يتم جمعها حديثا من Twitter و Reddit أن أسلوبنا تتفوق على الحالة السابقة من الفنون السابقة مع عدد أقل من المعلمات والتقارب الأسرع. تظهر تجارب وتحليل مستفيضة فعالية نماذجنا المقترحة وأشير أيضا إلى بعض الأفكار الرئيسية في تصميم المهام ذات الإشراف على الذات.
يمكن للتمثيلات السياقية المستفادة من طرازات اللغة غالبا ما ترميز سمات غير مرغوب فيها، مثل الجمعيات الديموغرافية للمستخدمين، أثناء التدريب على المهمة المستهدفة غير المرتبطة.نحن نهدف إلى فرك هذه السمات غير المرغوب فيها وتعلم التمثيلات العادلة مع الحفاظ على الأداء في المهمة المستهدفة.في هذه الورقة، نقدم إطارية تعليمية مخدمية، (ADS)، لتمثيلات ديبيا السياقية.نقوم بإجراء التحليل النظري لإظهار أن إطار العمل لدينا يتقوم دون تسريب المعلومات الديموغرافية في ظل ظروف معينة.نقوم بتوسيع تقنيات التقييم السابقة من خلال تقييم أداء DeviAsing باستخدام الحد الأدنى من التحقيق في الوصف (MDL).تظهر التقييمات التجريبية على 8 مجموعات البيانات أن الإعلانات تنشئ تمثيلات مع الحد الأدنى من المعلومات حول السمات الديموغرافية أثناء كونها بالتفكيك في الحد الأقصى حول المهمة المستهدفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا