ترغب بنشر مسار تعليمي؟ اضغط هنا

المعرفة تعزيز نموذج لغة ملثمين للكشف عن الموقف

Knowledge Enhanced Masked Language Model for Stance Detection

431   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة للعديد من مهام NLP، بما في ذلك اكتشاف الموقف.في هذه الورقة، نقترح طريقة رواية متناصة قائمة بذاتها تعزز نموذج اللغة الملثم للكشف عن الموقف.بدلا من إخفاء الرمز المميز العشوائي، نقترح استخدام نسبة مرجحة للأحكام المرجحة لتحديد الكلمات ذات الموقف العالي ومن ثم نموذج آلية الاهتمام التي تركز على هذه الكلمات.نظهر أن نهجنا المقترح يتفوق على حالة الفنية من أجل الكشف عن البيانات حول بيانات تويتر حول الانتخابات الرئاسية الأمريكية 2020.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الهدف من الكشف عن الموقف هو تحديد ما إذا كان مؤلف النص مؤلفا مؤلا، محايد أو ضد هدف محدد. على الرغم من التقدم الجوهري في هذه المهمة، فإن إحدى التحديات المتبقية هي ندرة التعليقات التوضيحية. يستخدم تكبير البيانات بشكل شائع لمعالجة ندرة التوضيحية عن طريق توليد المزيد من عينات التدريب. ومع ذلك، فإن الجمل المعزولة التي يتم إنشاؤها عن طريق الأساليب الحالية هي إما أقل تنوعا أو غير متسقة مع علامة الهدف والموقف المحدد. في هذه الورقة، صياغة تكبير البيانات للكشف عن الموقف كقوة نمذجة لغة مملحة مشروطة وزيادة مجموعة البيانات من خلال التنبؤ بالكلمة الملثمين المكيفة على كل من سياقها والجملة المساعدة التي تحتوي على معلومات الهدف والسمية. علاوة على ذلك، نقترح طريقة أخرى بسيطة ولكنها فعالة تولد الجملة المستهدفة من خلال استبدال هدف ذكر مع الآخر. تظهر النتائج التجريبية أن أسالكتنا المقترحة تتفوق بشكل كبير على أساليب التكبير السابقة على 11 أهداف.
نظرا لأن أنظمة NLP تصبح أفضل في اكتشاف الآراء والمعتقدات من النص، فمن المهم التأكد من أن النماذج ليس فقط دقيقة ولكنها تصل أيضا إلى تنبؤاتها بطرق تتماشى مع المنطق البشري.في هذا العمل، نقدم طريقة لإنقاذ الترشيد يشبه الإنسان نموذجا للكشف عن الموقف باستخ دام التعليقات التوضيحية الجماعية على جزء صغير من بيانات التدريب.نظرا لأنه في بيئة نادرة بيانات، فإن نهجنا يمكن أن يحسن منطق مصنف أحدث --- لا سيما للمدخلات التي تحتوي على ظواهر صعبة مثل السخرية - - دون أي تكلفة في الأداء التنبئي.علاوة على ذلك، نوضح أن الأوزان الاهتمام تتفوق على طريقة رائدة في تقديم تفسيرات مخلصة لتنبؤات النماذج لدينا، مما يخدم كمصدر رخيص وموثوق بحسب حسابي لنموذجنا.
النمذجة اللغوية المعقدة (MLM) هي واحدة من المهام الفرعية الرئيسية في محاكاة لغة الرؤية. في الإعداد عبر الوسائط، يتم ملثمين الرموز في الجملة بشكل عشوائي، والنموذج يتوقع أن تكون الرموز الممكنة التي أعطتها الصورة والنص. في هذه الورقة، نلاحظ العديد من عي وب MLM الرئيسية في هذا الإعداد. أولا، حيث تميل التسميات التوضيحية إلى أن تكون قصيرة، في ثلث الجمل لا يتم أخذ عينات من الجمل. ثانيا، غالبية الرموز الملثمين هي التوقف عن الكلمات وعلامات الترقيم، مما يؤدي إلى نقص في الاستخدام للصورة. إننا نحقق في مجموعة من استراتيجيات التقنيع البديلة المحددة لإعداد العرض المتعلق الذي يتناول هذه أوجه القصور، تهدف إلى توصيف أفضل من النص والصورة في التمثيل المستفاد. عند تدريب ما قبل التدريب على نموذج LXMERT، تتحسن استراتيجياتنا البديلة الخاصة بنا باستمرار عبر استراتيجية التقنيع الأصلية على ثلاثة مهام أسفل المصب، خاصة في إعدادات الموارد المنخفضة. علاوة على ذلك، يتفوق نهجنا قبل التدريب بشكل كبير على نموذج الأساس في مهمة التحقيق الفورية المصممة لاستنباط كائنات الصورة. تشير هذه النتائج وتحليلنا إلى أن طريقتنا تسمح باستفادة أفضل من بيانات التدريب.
التعاطف هو الرابط بين الذات والآخرين.اكتشاف وفهم التعاطف هو عنصر أساسي لتحسين التفاعل بين الإنسان.ومع ذلك، فإن التعليق البيانات للكشف عن التعاطف على نطاق واسع هو مهمة صعبة.توظف هذه الورقة تدريبات متعددة المهام مع تقطير المعرفة لدمج المعرفة من الموارد المتاحة (العاطفة والشعور) للكشف عن التعاطف عن اللغة الطبيعية في مجالات مختلفة.يؤدي هذا النهج إلى تحقيق نتائج أفضل على مجموعة بيانات التعاطف ذات الصلة بالأخبار مقارنة مع خطوط الأساس القوية.بالإضافة إلى ذلك، نبني مجموعة بيانات جديدة للتنبؤ بالتعاطف مع اتجاه التعاطف المحبوب الجميل، أو البحث عن أو توفير التعاطف، من تويتر.نطلق سراح DataSet لدينا لأغراض البحث.
يستلزم الكشف عن الموقف (SD) تصنيف معنويات نص تجاه هدف معين، وهي مهمة فرعية ذات صلة لتحليل تعدين الرأي والوسائط الإعلامية الاجتماعية.وقد استكشفت الأعمال الحديثة تسريب المعرفة تكمل الكفاءة اللغوية والمعرفة الكامنة عن النماذج اللغوية الكبيرة المدربة مسب قا مع الرسوم البيانية المعرفة المهيكلة (KGS)، ومع ذلك فقد طبقت القليل من الأعمال هذه الأساليب إلى مهمة SD.في هذا العمل، نقوم أولا بتحقيق المعرفة ذات الصلة بالموقف على النماذج المدربة المستندة مسبقا للمحولات في إعداد تسديدة صفرية، مما يدل على المعرفة الحقيقية الكامنة في النماذج حول أهداف SD وحساستها للسياق.ثم ندرب وتقييم نماذج الكشف عن الموقف المخصب على المعرفة على مجموعة بيانات لموقف Twitter، وتحقيق أداء حديثة على حد سواء.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا