ندرس مشكلة أداء تصنيف الموقف التلقائي على وسائل التواصل الاجتماعي مع البنية العصبية مثل بيرت. على الرغم من أن هذه المهنة تقدم نتائج مثيرة للإعجاب، إلا أن مستواها لم يقرص بعد مع أحد البشر وقد ينتجون أخطاء له تأثير كبير على المهمة المصب (على سبيل المثال، فحص الحقائق). لتحسين الأداء، نقدم الهندسة المعمارية العصبية الجديدة حيث تتضمن المدخلات أيضا وجهات نظر مفاجئة تلقائيا بسبب مطالبة معينة. يتم تعلم النموذج بشكل مشترك إجراء توقعات متعددة في وقت واحد، والتي يمكن استخدامها إما لتحسين تصنيف المنظور الأصلي أو لتصفية التنبؤات المشكوك فيها. في الحالة الأولى، نقترح طريقة خاضعة للإشراف ضعيفا للجمع بين التنبؤات في نهائي. في الحالة الثانية، نوضح أن استخدام درجات الثقة لإزالة التنبؤات المشكوك فيه يسمح لطريقنا لتحقيق أداء يشبه الإنسان على المعلومات المحتجزة، والتي لا تزال جزءا كبيرا من المدخلات الأصلية.
We study the problem of performing automatic stance classification on social media with neural architectures such as BERT. Although these architectures deliver impressive results, their level is not yet comparable to the one of humans and they might produce errors that have a significant impact on the downstream task (e.g., fact-checking). To improve the performance, we present a new neural architecture where the input also includes automatically generated negated perspectives over a given claim. The model is jointly learned to make simultaneously multiple predictions, which can be used either to improve the classification of the original perspective or to filter out doubtful predictions. In the first case, we propose a weakly supervised method for combining the predictions into a final one. In the second case, we show that using the confidence scores to remove doubtful predictions allows our method to achieve human-like performance over the retained information, which is still a sizable part of the original input.
References used
https://aclanthology.org/
We present new results for the problem of sequence metaphor labeling, using the recently developed Visibility Embeddings. We show that concatenating such embeddings to the input of a BiLSTM obtains consistent and significant improvements at almost no cost, and we present further improved results when visibility embeddings are combined with BERT.
Stance detection determines whether the author of a text is in favor of, against or neutral to a specific target and provides valuable insights into important events such as legalization of abortion. Despite significant progress on this task, one of
Identification of lexical borrowings, transfer of words between languages, is an essential practice of historical linguistics and a vital tool in analysis of language contact and cultural events in general. We seek to improve tools for automatic dete
Text classifiers are regularly applied to personal texts, leaving users of these classifiers vulnerable to privacy breaches. We propose a solution for privacy-preserving text classification that is based on Convolutional Neural Networks (CNNs) and Se
The widespread use of the Internet and the rapid dissemination of information poses the challenge of identifying the veracity of its content. Stance detection, which is the task of predicting the position of a text in regard to a specific target (e.g