في وسائل التواصل الاجتماعي، يستخدم المستخدمون بشكل متكرر صور صغيرة تسمى الرموز التعبيرية في مشاركاتها. على الرغم من أن استخدام الرموز التعبيرية في النصوص يلعب دورا رئيسيا في أنظمة الاتصالات الحديثة، فقد تم إيلاء اهتمام أقل في مواقعهم في النصوص المعينة، على الرغم من أن المستخدمين الذين يختارون بعناية ووضع الرموز التعبيرية التي تطابق رسالتها. ستعمل استكشاف مواقع الرموز التعبيرية في النصوص على تعزيز الفهم للعلاقة بين الرموز التعبيرية والنصوص. نقوم بتوسيع مهمة التنبؤ بالملصقات الرموز التعبيرية مع مراعاة معلومات مواقع الرموز التعبيرية، من خلال تعلم موقف الرموز التعبيري في تغريدة الرموز التعبيرية للتنبؤ بميزة الرموز التعبيرية. توضح النتائج أن موقف الرموز التعبيري في النصوص هو فكرة جيدة لتعزيز أداء تنبؤ التسمية الرموز التعبيرية. التقييم البشري يتحقق من صحة موقع emoji مناسب في تغريدة، ومهمةنا المقترحة قادرة على جعل تغريدات أكثر فاخرة وطبيعية. بالإضافة إلى ذلك، النظر في موقف الرموز التعبيري يمكن أن يحسن أداء مهمة الكشف عن المفارقة مقارنة بتنبؤ تسمية الرموز التعبيرية. نبلغ أيضا عن النتائج التجريبية لمجموعة البيانات المعدلة، نظرا لمشكلة البيانات الأصلية للمهمة المشتركة الأولى للتنبؤ بتسمية EMOJI في Semeval2018.
In the social media, users frequently use small images called emojis in their posts. Although using emojis in texts plays a key role in recent communication systems, less attention has been paid on their positions in the given texts, despite that users carefully choose and put an emoji that matches their post. Exploring positions of emojis in texts will enhance understanding of the relationship between emojis and texts. We extend an emoji label prediction task taking into account the information of emoji positions, by jointly learning the emoji position in a tweet to predict the emoji label. The results demonstrate that the position of emojis in texts is a good clue to boost the performance of emoji label prediction. Human evaluation validates that there exists a suitable emoji position in a tweet, and our proposed task is able to make tweets more fancy and natural. In addition, considering emoji position can further improve the performance for the irony detection task compared to the emoji label prediction. We also report the experimental results for the modified dataset, due to the problem of the original dataset for the first shared task to predict an emoji label in SemEval2018.
References used
https://aclanthology.org/
Emoji (the popular digital pictograms) are sometimes seen as a new kind of artificial and universally usable and consistent writing code. In spite of their assumed universality, there is some evidence that the sense of an emoji, specifically in regar
With the rise of research on toxic comment classification, more and more annotated datasets have been released. The wide variety of the task (different languages, different labeling processes and schemes) has led to a large amount of heterogeneous da
Sensitivity of deep-neural models to input noise is known to be a challenging problem. In NLP, model performance often deteriorates with naturally occurring noise, such as spelling errors. To mitigate this issue, models may leverage artificially nois
Addressing the mismatch between natural language descriptions and the corresponding SQL queries is a key challenge for text-to-SQL translation. To bridge this gap, we propose an SQL intermediate representation (IR) called Natural SQL (NatSQL). Specif
Computational models of human language often involve combinatorial problems. For instance, a probabilistic parser may marginalize over exponentially many trees to make predictions. Algorithms for such problems often employ dynamic programming and are