تصف هذه الورقة أساليبنا المقدمة لمهمة Germeval 2021 المشتركة بشأن تحديد تعليقات سمية ومشاركة في الحقائق في نصوص وسائل التواصل الاجتماعي (RISCH et al.، 2021).نستكشف استراتيجيات بسيطة للجيل شبه التلقائي من الأنظمة القائمة على القواعد ذات الدقة عالية واستدعاء منخفضة، واستخدامها لتحقيق تحسينات إجمالية طفيفة على تصنيف قياسي مقرها بيرت.
This paper describes our methods submitted for the GermEval 2021 shared task on identifying toxic, engaging and fact-claiming comments in social media texts (Risch et al., 2021). We explore simple strategies for semi-automatic generation of rule-based systems with high precision and low recall, and use them to achieve slight overall improvements over a standard BERT-based classifier.
المراجع المستخدمة
https://aclanthology.org/
تتناول هذه الورقة تحديد تعليقات سامة ومشاركة وتحقيق الحقائق على وسائل التواصل الاجتماعي.استخدمنا مجموعة البيانات المتاحة من قبل منظمي المهمة المشتركة Germeval2021 التي تحتوي على أكثر من 3000 تعليقات Facebook المزروعة يدويا باللغة الألمانية.بالنظر إلى
في هذه الورقة، نقدم مساهمة UPAPPLIEDCL في مهمة جيرفال 2021 المشتركة.على وجه الخصوص، شاركنا في SubTasks 2 (تصنيف التعليق التجاري) و 3 (تصنيف التعليق الذي يدعي الحقائق).على الرغم من أن النتائج المقبولة يمكن الحصول عليها باستخدام أجهزة UNIGRAMS أو الميز
في هذه الورقة، نبلغ عن نهجنا لمعالجة المهمة المشتركة ل Germeval 2021 بشأن تحديد تعليقات سمية ومشاركة وحقائق اللغة الألمانية. لقد قدمنا ثلاثة أشواط لكل فرقة فرعية بناء على مجموعات من ثلاث نماذج تستخدم من حيث أن تضمينات سياقية من نماذج اللغة المدربة
نقدم Germeval 2021 المهمة المشتركة بشأن تحديد تعليقات السامة والإخراجية والحقائق. تضم هذه المهمة المشتركة ثلاث مجموعات فرعية تصنيف ثنائية بهدف تحديد: تعليقات سامة، وإشراك التعليقات، والتعليقات التي تشمل مؤشرات على الحاجة إلى فحص الحقائق، يشار إليها ه
أدى توافر تمثيلات اللغة التي تعلمتها نماذج الشبكة العصبية العصبية الكبيرة (مثل Bert and Electra) إلى تحسينات في العديد من مهام معالجة اللغة الطبيعية المصب في السنوات الأخيرة.تختلف النماذج المحددة عادة في الأهداف المحددة، والبنية، ومجموعات البيانات ال