ترغب بنشر مسار تعليمي؟ اضغط هنا

تعلم الصورة الكبيرة: التمثيل تعلم التجميع

Learn The Big Picture: Representation Learning for Clustering

251   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تجد النماذج الموجودة الإشراف على النصوص النصية صعوبة في تحسين نتائج تجميعها مباشرة.وذلك لأن التجميع عملية منفصلة، ومن الصعب تقدير التدرج المجدي لأي وظيفة منفصلة يمكن أن تدفع خوارزميات التحسين المستندة إلى التدرج.لذا، فإن خوارزميات التجميع الموجودة محتجزة بشكل غير مباشر تحقق بشكل غير مباشر لبعض الوظائف المستمرة التي تقارب عملية التجميع.نقترح استراتيجية تدريبية قابلة للتطوير التي تعمل بشكل مباشر على متري تجميع منفصل.نحن ندرب نموذج التضمين القائم على بيرت باستخدام أسلوبنا وتقييمه على مجموعة بيانات متوفرة للجمهور.نظهر أن أسلوبنا تتفوق على نموذج آخر مضمون يستند إلى بيرت توظف خسارة ثلاثية وغيرها من خطوط الأساس غير المدعومة.هذا يشير إلى أن التحسين مباشرة لنتائج التجميع تعطي بالفعل تمثيل أفضل مناسبة للتجميع.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يعد تحسين تعميم النموذج حول البيانات المحتفظ بها أحد الأهداف الأساسية في التفكير المعني بالمعنى. لقد أظهر العمل الحديث أن النماذج المدربة على مجموعة البيانات مع الإشارات السطحية تميل إلى أداء جيد في الاختبار السهل مع الإشارات السطحية ولكنها تؤدي بشكل سيء على مجموعة الاختبار الثابت دون إشارات سطحية. لجأت النهج السابقة إلى الأساليب اليدوية لتشجيع النماذج غير المبالفة للعظة السطحية. في حين أن بعض الأساليب قد تحسن الأداء على الحالات الصعبة، فإنها تؤدي أيضا إلى أدائها المتدهورة بشأن التعرضات السهلة. هنا، نقترح أن تتعلم صراحة نموذجا جيدا على كل من مجموعة الاختبار السهلة مع الإشارات السطحية ومجموعة الاختبار الثابت دون إشارات سطحية. باستخدام هدف التعلم التلوي، نتعلم مثل هذا النموذج الذي يحسن الأداء على كل من مجموعة الاختبار السهلة ومجموعة الاختبار الثابت. من خلال تقييم نماذجنا عند اختيار البدائل المعقولة (COPA) وشرح المنطقي، نوضح أن أسلوبنا المقترح يؤدي إلى تحسين الأداء على كل من مجموعة الاختبارات السهلة ومجموعة الاختبار الصعب الذي نلاحظ عليه ما يصل إلى 16.5 نقطة مئوية من التحسن على أساس الأساس وبعد
يعد إعادة صياغة نص إعادة صياغة مهمة NLP طويلة الأمد لديها تطبيقات متنوعة على مهام NLP المصب. ومع ذلك، تعتمد فعالية الجهود الحالية في الغالب على كميات كبيرة من البيانات الذهبية المسمى. على الرغم من أن المساعي غير الخاضعة للإشعال قد اقترحت تخفيف هذه ال مسألة، إلا أنها قد تفشل في توليد صياغة هادفة بسبب عدم وجود إشارات الإشراف. في هذا العمل، نذهب إلى أبعد من النماذج الحالية واقتراح نهج رواية لتوليد صياغة عالية الجودة مع بيانات الإشراف الضعيف. على وجه التحديد، نتعامل مع مشكلة توليد إعادة صياغة الإشراف ضعيفا من خلال: (1) الحصول على جمل متوازية ضعيفة وفرة عن طريق توسيع إعادة صياغة الزائفة القائمة على استرجاع؛ و (2) تطوير إطار تعليمي التعلم إلى تحديد عينات قيمة تدريجيا لضبط النموذج اللغوي المدرب مسبقا في مهمة إعادة توجيهها مسبقا في مهمة إعادة الصياغة الخطية. نوضح أن نهجنا يحقق تحسينات كبيرة على النهج القائمة غير المدمرة، وهو ما يمكن قابلة للمقارنة في الأداء مع أحدث من الفنون المغلفة.
نقدم نهجا للتعلم اكتشاف سقالة لإدخال مفاهيم في دورة معالجة اللغة الطبيعية تهدف إلى طلاب علوم الكمبيوتر في مؤسسات الفنون الليبرالية.نحن نصف بعض أهداف هذا النهج، بالإضافة إلى تقديم طرق محددة أن أربعة من المهام التي تعتمد على اكتشافها تجمع بين مفاهيم مع الجة اللغة الطبيعية المحددة مع مهارات تحليلية أوسع.نقول أن هذا النهج يساعد في إعداد الطلاب للحصول على العديد من المسارات المستقبلية الممكنة التي تنطوي على تطبيق وابتكار تكنولوجيا NLP من خلال التركيز على الملاحة التجريبية للبيانات، وتصميم التجريب، والوعي في تعقيدات وتحديات التحليل.
غالبا ما تستخدم Lemmatization من اللغات الغنية المورفولوجية لمعالجة القضايا الناجمة عن التعقيد المورفولوجي، التي أجريتها Lemmatizers القائم على القواعد.نقترح بديلا لهذا، في شكل أداة تقوم بتنفيذ Lemmatization في مساحة Word Embeddings.تضيء كلمة كتمثيل موزز أصلي بعض المعلومات حول العلاقة بين الأساس والنماذج المؤذية، وإظهار أنه من الممكن تعلم التحول الذي يوصي ما يقرب من تضييق أشرطة النماذج التي تم تأصيلها إلى Admass of the المقابلة.يؤدي هذا إلى تسهيل خط أنابيب معالجة بديل يحل محل الليمات التقليدية مع التحول الليمون في معالجة المصب لأي تطبيق.نوضح الطريقة في اللغة الفنلندية، مما يتفوق على Lemmatizers التقليدية على سبيل المثال مهمة مقارنة تشابه الوثيقة، ولكن النهج مستقلة للغة ويمكن تدريب لغات جديدة مع متطلبات خفيفة.
لكل مهمة حوار موجهة نحو تحقيق الأهداف ذات أهمية، يجب جمع كميات كبيرة من البيانات للحصول على التعلم المنتهي للنظام الحوار العصبي.جمع هذه البيانات هي عملية مكلفة وتستغرق وقتا طويلا.بدلا من ذلك، نوضح أنه يمكننا استخدام كمية صغيرة فقط من البيانات، والتي تستكمل البيانات من مهمة حوار ذات صلة.فشل التعلم بسذاجة من البيانات ذات الصلة في تحسين الأداء لأن البيانات ذات الصلة يمكن أن تكون غير متسقة مع المهمة المستهدفة.نحن نصف طريقة تعتمد على التعلم التعريفي والتي تتعلم بشكل انتقائي من بيانات مهمة الحوار ذات الصلة.نهجنا يؤدي إلى تحسينات بدقة كبيرة في مهمة الحوار مثال.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا