ترغب بنشر مسار تعليمي؟ اضغط هنا

المعرفة تقطير للكشف عن التعاطف

Distilling Knowledge for Empathy Detection

149   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

التعاطف هو الرابط بين الذات والآخرين.اكتشاف وفهم التعاطف هو عنصر أساسي لتحسين التفاعل بين الإنسان.ومع ذلك، فإن التعليق البيانات للكشف عن التعاطف على نطاق واسع هو مهمة صعبة.توظف هذه الورقة تدريبات متعددة المهام مع تقطير المعرفة لدمج المعرفة من الموارد المتاحة (العاطفة والشعور) للكشف عن التعاطف عن اللغة الطبيعية في مجالات مختلفة.يؤدي هذا النهج إلى تحقيق نتائج أفضل على مجموعة بيانات التعاطف ذات الصلة بالأخبار مقارنة مع خطوط الأساس القوية.بالإضافة إلى ذلك، نبني مجموعة بيانات جديدة للتنبؤ بالتعاطف مع اتجاه التعاطف المحبوب الجميل، أو البحث عن أو توفير التعاطف، من تويتر.نطلق سراح DataSet لدينا لأغراض البحث.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة للعديد من مهام NLP، بما في ذلك اكتشاف الموقف.في هذه الورقة، نقترح طريقة رواية متناصة قائمة بذاتها تعزز نموذج اللغة الملثم للكشف عن الموقف.بدلا من إخفاء الرمز المميز العشوائي، نقترح استخدام نسبة مرجحة للأحكام المرجحة لتحديد الكلمات ذات الموقف العالي ومن ثم نموذج آلية الاهتمام التي تركز على هذه الكلمات.نظهر أن نهجنا المقترح يتفوق على حالة الفنية من أجل الكشف عن البيانات حول بيانات تويتر حول الانتخابات الرئاسية الأمريكية 2020.
تتمثل الوصفة الحالية لأداء نموذج أفضل داخل NLP في زيادة حجم نموذج البيانات والتدريب.في حين أن ذلك يعطينا نماذج مع نتائج رائعة بشكل متزايد، إلا أنها تجعل من الصعب تدريب ونشر نماذج أحدث ل NLP بسبب زيادة التكاليف الحاسوبية.ضغط النموذج هو مجال للبحث الذي يهدف إلى تخفيف هذه المشكلة.يشمل هذا المجال أساليب مختلفة تهدف إلى الحفاظ على أداء نموذج أثناء تقليل حجمها.واحدة من هذه الأسلوب هو تقطير المعرفة.في هذه المقالة، نحقق في تأثير تقطير المعرفة لنماذج التعرف على الكيان المسمى باللغة السويدية.نظهر أنه في حين أن بعض نماذج علامات التسلسل تستفيد من تقطير المعرفة، وليس كل النماذج تفعل.هذا يطالبنا بطرح أسئلة حول المواقف التي تنفجر المعرفة النماذج مفيدة.نحن أيضا السبب في تأثير تقطير المعرفة على التكاليف الحاسوبية.
للحد من حجم النموذج ولكن الاحتفاظ بالأداء، كنا نعتمد في كثير من الأحيان على تقطير المعرفة (دينار كويتي) الذي ينقل المعرفة من نموذج المعلم الكبير إلى نموذج طالب أصغر. ومع ذلك، فإن KD على مجموعات بيانات متعددة الوسائط مثل مهام اللغة الرؤية غير مستكشفة نسبيا، وهضم معلومات متعددة الوسائط تحديا لأن طرائق مختلفة تقدم أنواعا مختلفة من المعلومات. في هذه الورقة، نقوم بإجراء دراسة تجريبية واسعة النطاق للتحقيق في أهمية وآثار كل طريقة في تقطير المعرفة. علاوة على ذلك، نقدم إطارا لتقطير المعرفة متعددة الوسائط، وقطاع التقطير الخاص بالطرياء (MSD)، لنقل المعرفة من المعلم عن مهام متعددة الوسائط عن طريق تعلم سلوك المعلم داخل كل طريقة. تهدف الفكرة إلى تحية التنبؤات الخاصة بنوية المعلم من خلال إدخال شروط الخسائر المساعدة لكل طريقة. علاوة على ذلك، نظرا لأن كل طريقة لها اتفاقية مختلفة بالنسبة للتنبؤات، فإننا نحدد درجات الرافية لكل طريقة وتحقيق في مخططات الترجيح القائم على الرافية للخسائر الإضافية. ندرس نهج تعليم الوزن لمعرفة الأثقال المثلى على شروط الخسارة هذه. في تحليلنا التجريبي، نقوم بفحص اتفاقية كل طريقة في KD، وأوضح فعالية نظام الترجيح في MSD، وإظهار أنه يحقق أداء أفضل من KD على أربعة مجموعات بيانات متعددة الوسائط.
الكشف عن العلاقة في أسئلة المعرفة الأساسية الإجابة، تهدف إلى تحديد مسار (ق) العلاقات بدءا من عقدة كيان الموضوع المرتبطة بعقدة الإجابة في الرسم البياني للمعرفة. قد يتكون هذا المسار من علاقات متعددة، نسميه متعدد القفز. علاوة على ذلك، للحصول على سؤال وا حد، قد توجد مسارات علاقة متعددة للإجابة الصحيحة، والتي نسميها متعددة الملصقات. ومع ذلك، فإن معظم الأساليب الموجودة لا تكتشف مسارا واحدا فقط للحصول على الإجابة دون النظر في المسارات الصحيحة الأخرى، والتي قد تؤثر على الأداء النهائي. لذلك، في هذه الورقة، نقترح نهجا جديدا للقسمة والانقسام للكشف عن العلاقة متعددة الملصقات متعددة العلامات (DC-MLMH) من خلال تحللها في الكشف عن العلاقة بين الرأس وتوليد مسار العلاقة الشرطية. في محددة، يقترح آلية أخذ العينات على مسار رواية لتوليد مسارات علاقة متنوعة لمرحلة الاستدلال. يتم استخدام سياسة الأصوات للأغلبية للكشف عن إجابة KB النهائية. أجريت تجارب شاملة على مجموعة بيانات Freebaseqa القياسية. تشير النتائج التجريبية إلى أن النهج المقترح لا يتفوق فقط على خطوط خطوط الأساس التنافسية المتعددة التسمية، ولكن أيضا تفوق على بعض أساليب KBQA الحديثة.
في هذه الورقة، نطبق تقطير المعرفة الذاتية لتلخيص النص الذي نقوله أنه يمكن أن يخفف من مشاكل في الحد الأقصى للتدريب احتمالية على مجموعات بيانات مرجعية واحدة وصاخبة.بدلا من الاعتماد على ملصقات توضيحية ذات ساخنة واحدة، يتم تدريب نموذج تلخيص الطلاب لدينا مع توجيهات من المعلم الذي يولد ملصقات سلاسة للمساعدة في تنظيم التدريب.علاوة على ذلك، لتحسين نموذج عدم اليقين أثناء التدريب، نقدم إشارات متعددة الضوضاء لكل من نماذج المعلم والطلاب.نوضح تجريبيا في ثلاثة معايير أن إطار عملائنا يعزز أداء كل من الملاحظات المحددة أو غير مسبوقة تحقيق نتائج حالة من الفنون.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا