ترغب بنشر مسار تعليمي؟ اضغط هنا

تحسين اكتشاف الموقف مع التعلم متعدد البيانات والتقطير المعرفي

Improving Stance Detection with Multi-Dataset Learning and Knowledge Distillation

219   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يحدد اكتشاف الموقف ما إذا كان مؤلف النص مؤهلا لصالح أو محايد هدف معين ويوفر رؤى قيمة في أحداث مهمة مثل تقنين الإجهاض. على الرغم من التقدم الكبير في هذه المهمة، فإن أحد التحديات المتبقية هو ندرة التعليقات التوضيحية. علاوة على ذلك، ركزت معظم الأعمال السابقة على تدريبا ثابتا على التسمية التي يتم فيها التخلص منها تشابه ذات معنى بين الفئات أثناء التدريب. لمعالجة هذه التحديات أولا، نقيم هدف متعدد المستهدف وإعدادات تدريب متعددة البيانات من خلال تدريب نموذج واحد على كل مجموعة بيانات ومجموعات من المجالات المختلفة، على التوالي. نظهر أن النماذج يمكن أن تتعلم المزيد من التمثيلات العالمية فيما يتعلق بالأهداف في هذه الإعدادات. ثانيا، يمكننا التحقيق في تقطير المعرفة في اكتشاف الموقف ومراقبة أن نقل المعرفة من نموذج المعلم إلى نموذج الطالب يمكن أن يكون مفيدا في إعدادات التدريب المقترحة. علاوة على ذلك، نقترح طريقة تقطير المعرفة التكيفية (AKD) تطبق تحجيم درجة الحرارة الخاصة بالمثيلات إلى المعلم والتنبؤات الطلابية. تشير النتائج إلى أن نموذج متعدد البيانات يعمل بشكل أفضل على جميع مجموعات البيانات ويمكن تحسينه من قبل AKD المقترح، مما يتفوق على أحدث حالة من الهامش الكبير. نحن نطلق علنا ​​كودنا.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لقد أثبتت التعلم المناهج الدراسية، وهي استراتيجية تدريب الآلة التي تغذي حالات التدريب على النموذج من سهولة الصعب، لتسهيل مهمة توليد الحوار. وفي الوقت نفسه، يمكن أن تسفر عن طريقة تقطير المعرفة، منهجية تحويل المعرفة بين المعلمين وشبكات الطلاب دفعة كبير ة من الأداء لنماذج الطلاب. وبالتالي، في هذه الورقة، نقدم مجموعة من التعلم من المناهج الدراسية وتقطير المعرفة لنماذج جيل الحوار الفعالة، حيث يمكن أن يساعد تعلم المناهج الدراسية في تقطير المعارف من جوانب البيانات والنموذج. للبدء، من جانب البيانات، نقوم بتجميع حالات التدريب وفقا لتعقيدها، والتي تحسبها أنواع مختلفة من الميزات مثل طول الجملة والتماسك بين أزواج الحوار. علاوة على ذلك، فإننا نوظف استراتيجية تدريبية عدائية لتحديد تعقيد الحالات من مستوى النموذج. الحدس هو أنه، إذا كان بإمكان التمييز أن يخبر الاستجابة الناتجة عن المعلم أو الطالب، فسيكون الأمر من الصعب على الحالة أن نموذج الطالب لم يتكيف حتى الآن. أخيرا، نستخدم التعلم الذاتي، وهو امتداد لتعلم المناهج الدراسية لتعيين الأوزان لتقطير. في الختام، نقوم بترتيب منهج هرمي يستند إلى الجوانب المذكورة أعلاه لنموذج الطالب بموجب الإرشاد من نموذج المعلم. توضح النتائج التجريبية أن أساليبنا تحقق تحسينات مقارنة مع خطوط الأساس التنافسية.
يعتمد النمذجة وفهم الحوارات في محادثة على تحديد نية المستخدم من النص المحدد. كشف نية غير معروفة أو جديدة مهمة حاسمة، كما هو الحال في سيناريو واقعي قد يتغير نية المستخدم بشكل متكرر مع مرور الوقت وتحويله حتى إلى نية غير مرفدة. هذه المهمة المتمثلة في فص ل عينات النية المجهولة من النوايا المعروفة واحدة صعبة حيث يمكن أن يتراوح نية المستخدم غير المعروفة من النوايا المشابهة للحالة المحددة مسبقا لشيء مختلف تماما. غالبا ما ينظر البحث المسبق في اكتشاف النية كهمة تصنيف حيث يمكن أن ينتمي نية غير معروفة إلى مجموعة محددة مسبقا من فئات النية المعروفة. في هذه الورقة، نتعامل مع مشكلة الكشف عن نية غير معروفة تماما دون أي تلميحات مسبقة حول نوع الطبقات التي تنتمي إلى نوايا غير معروفة. نقترح طريقة فعالة لما بعد المعالجة باستخدام التحسين متعدد الأهداف لضبط مصنف نوايا NEWRET NEWRET NEWELTION موجود وجعله قادر على اكتشاف حطاء غير معروف. نحن نقوم بإجراء تجارب باستخدام مصنفات النوايا الحالية الحالية واستخدام طريقةنا على رأسها لكشف نية غير معروفة. تظهر تجاربنا عبر المجالات المختلفة ومجموعات البيانات في العالم الحقيقي أن طريقتنا تعطي تحسينات كبيرة مقارنة بالطرق الحديثة للكشف عن النية غير معروفة.
ندرس مشكلة أداء تصنيف الموقف التلقائي على وسائل التواصل الاجتماعي مع البنية العصبية مثل بيرت. على الرغم من أن هذه المهنة تقدم نتائج مثيرة للإعجاب، إلا أن مستواها لم يقرص بعد مع أحد البشر وقد ينتجون أخطاء له تأثير كبير على المهمة المصب (على سبيل المثا ل، فحص الحقائق). لتحسين الأداء، نقدم الهندسة المعمارية العصبية الجديدة حيث تتضمن المدخلات أيضا وجهات نظر مفاجئة تلقائيا بسبب مطالبة معينة. يتم تعلم النموذج بشكل مشترك إجراء توقعات متعددة في وقت واحد، والتي يمكن استخدامها إما لتحسين تصنيف المنظور الأصلي أو لتصفية التنبؤات المشكوك فيها. في الحالة الأولى، نقترح طريقة خاضعة للإشراف ضعيفا للجمع بين التنبؤات في نهائي. في الحالة الثانية، نوضح أن استخدام درجات الثقة لإزالة التنبؤات المشكوك فيه يسمح لطريقنا لتحقيق أداء يشبه الإنسان على المعلومات المحتجزة، والتي لا تزال جزءا كبيرا من المدخلات الأصلية.
الهدف من الكشف عن الموقف هو تحديد ما إذا كان مؤلف النص مؤلفا مؤلا، محايد أو ضد هدف محدد. على الرغم من التقدم الجوهري في هذه المهمة، فإن إحدى التحديات المتبقية هي ندرة التعليقات التوضيحية. يستخدم تكبير البيانات بشكل شائع لمعالجة ندرة التوضيحية عن طريق توليد المزيد من عينات التدريب. ومع ذلك، فإن الجمل المعزولة التي يتم إنشاؤها عن طريق الأساليب الحالية هي إما أقل تنوعا أو غير متسقة مع علامة الهدف والموقف المحدد. في هذه الورقة، صياغة تكبير البيانات للكشف عن الموقف كقوة نمذجة لغة مملحة مشروطة وزيادة مجموعة البيانات من خلال التنبؤ بالكلمة الملثمين المكيفة على كل من سياقها والجملة المساعدة التي تحتوي على معلومات الهدف والسمية. علاوة على ذلك، نقترح طريقة أخرى بسيطة ولكنها فعالة تولد الجملة المستهدفة من خلال استبدال هدف ذكر مع الآخر. تظهر النتائج التجريبية أن أسالكتنا المقترحة تتفوق بشكل كبير على أساليب التكبير السابقة على 11 أهداف.
يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة للعديد من مهام NLP، بما في ذلك اكتشاف الموقف.في هذه الورقة، نقترح طريقة رواية متناصة قائمة بذاتها تعزز نموذج اللغة الملثم للكشف عن الموقف.بدلا من إخفاء الرمز المميز العشوائي، نقترح استخدام نسبة مرجحة للأحكام المرجحة لتحديد الكلمات ذات الموقف العالي ومن ثم نموذج آلية الاهتمام التي تركز على هذه الكلمات.نظهر أن نهجنا المقترح يتفوق على حالة الفنية من أجل الكشف عن البيانات حول بيانات تويتر حول الانتخابات الرئاسية الأمريكية 2020.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا