في هذه الورقة، نحقق في فعالية استخدام المدينات السياقية من بيرت متعددة اللغات، بيرت الألمانية في تحديد تعليقات المطالبة بالحقائق باللغة الألمانية على وسائل التواصل الاجتماعي.بالإضافة إلى ذلك، ندرس تأثير صياغة مشكلة التصنيف كأداة تعليمية متعددة المهام، حيث يحدد النموذج السمية ومشاركة التعليق بالإضافة إلى تحديد ما إذا كان يدعي الحقيقة.نحن نقدم مقارنة شاملة من النماذج التي تستند إلى بيرت مقارنة بناسي الانحدار اللوجستي وإظهار أن ميزات بيرت الألمانية المدربة باستخدام هدف متعدد المهام يحقق أفضل درجة F1 في مجموعة الاختبار.تم تنفيذ هذا العمل كجزء من تقديم المهمة المشتركة ل Germeval 2021 بشأن تحديد تعليقات المطالبة بالحقائق.
In this paper we investigate the efficacy of using contextual embeddings from multilingual BERT and German BERT in identifying fact-claiming comments in German on social media. Additionally, we examine the impact of formulating the classification problem as a multi-task learning problem, where the model identifies toxicity and engagement of the comment in addition to identifying whether it is fact-claiming. We provide a thorough comparison of the two BERT based models compared with a logistic regression baseline and show that German BERT features trained using a multi-task objective achieves the best F1 score on the test set. This work was done as part of a submission to GermEval 2021 shared task on the identification of fact-claiming comments.
المراجع المستخدمة
https://aclanthology.org/
أدى توافر تمثيلات اللغة التي تعلمتها نماذج الشبكة العصبية العصبية الكبيرة (مثل Bert and Electra) إلى تحسينات في العديد من مهام معالجة اللغة الطبيعية المصب في السنوات الأخيرة.تختلف النماذج المحددة عادة في الأهداف المحددة، والبنية، ومجموعات البيانات ال
في هذا العمل، نقدم نهجنا على مهمة تصنيف التعليقات السامة (الفرعية 1) من المهمة المشتركة لجيرفال 2021.لهذه المهمة الثنائية، نقترح ثلاث نماذج: نموذج محول بيرت ألماني؛Perceptron متعدد الطبقات، التي تم تدريبها لأول مرة بالتوازي على الإدخال النصي و 14 ميز
في هذه الورقة، نقدم مساهمة UPAPPLIEDCL في مهمة جيرفال 2021 المشتركة.على وجه الخصوص، شاركنا في SubTasks 2 (تصنيف التعليق التجاري) و 3 (تصنيف التعليق الذي يدعي الحقائق).على الرغم من أن النتائج المقبولة يمكن الحصول عليها باستخدام أجهزة UNIGRAMS أو الميز
نبلغ عن تقديمنا إلى المهمة 1 من تحدي جيرفال 2021 - تصنيف التعليق السام.نحقق في طرق مختلفة لتعزيز البيانات التدريبية النادرة لتحسين الأداء النموذجي خارج الرف على مهمة تصنيف سامة للتعليق.للمساعدة في معالجة قيود مجموعة بيانات صغيرة، نستخدم البيانات التي
في هذه الورقة، نبلغ عن نهجنا لمعالجة المهمة المشتركة ل Germeval 2021 بشأن تحديد تعليقات سمية ومشاركة وحقائق اللغة الألمانية. لقد قدمنا ثلاثة أشواط لكل فرقة فرعية بناء على مجموعات من ثلاث نماذج تستخدم من حيث أن تضمينات سياقية من نماذج اللغة المدربة