تعليق المستخدم هو ميزة قيمة للعديد من المنافذ الإخبارية، مما يتيح لهم اتصال مع القراء وتمكين القراء للتعبير عن رأيهم، وتوفير وجهات نظر مختلفة، وحتى المعلومات التكميلية. ومع ذلك، من الصعب تصفية كميات كبيرة من تعليقات المستخدمين، ناهيك عن قراءة واستخراج المعلومات ذات الصلة. لا يزال البحث في تلخيص تعليقات المستخدمين في مهده، ومجموعات بيانات التلخيص التي تم إنشاؤها الإنسان نادرة، خاصة بالنسبة لغات أقل الموارد. لمعالجة هذه المشكلة، نقترح نهج غير مدعوم لتلخيص تعليقات المستخدم، والذي يستخدم تمثيل حديث متعدد اللغات للجمل جنبا إلى جنب مع تقنيات تلخيص الاستخراج القياسية. تقارننا مناهج تمثيل الجملة المختلفة مقترن بنهج تلخيص مختلفة يدل على أن أكثر المجموعات ناجحة هي نفسها في الأخبار وتلخيص التعليق. النتائج التجريبية وعرضت تصور تظهر فائدة المنهجية المقترحة لعدة لغات.
User commenting is a valuable feature of many news outlets, enabling them a contact with readers and enabling readers to express their opinion, provide different viewpoints, and even complementary information. Yet, large volumes of user comments are hard to filter, let alone read and extract relevant information. The research on the summarization of user comments is still in its infancy, and human-created summarization datasets are scarce, especially for less-resourced languages. To address this issue, we propose an unsupervised approach to user comments summarization, which uses a modern multilingual representation of sentences together with standard extractive summarization techniques. Our comparison of different sentence representation approaches coupled with different summarization approaches shows that the most successful combinations are the same in news and comment summarization. The empirical results and presented visualisation show usefulness of the proposed methodology for several languages.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، فإننا نطبق غير المدعومة غير المدعومة باعتبارها مهمة جديدة في تحريض الهيكل النحوي، والتي مفيدة لفهم الهياكل اللغوية للغات البشرية وكذلك معالجة لغات الموارد المنخفضة.نقترح اتباع نهج نقل المعرفة بأنه يسخر بشكل مسبق تسميات القطعة من نماذج
تعرف مهمة تحويل نص غير قياسي إلى نص قياسي وقابل للقراءة باسم التطبيع المعجمي. تتطلب جميع تطبيقات معالجة اللغة الطبيعية تقريبا (NLP) البيانات النصية في النموذج الطبيعي لإنشاء نماذج محددة ذات جودة عالية. وبالتالي، فقد ثبت التطبيع المعجمي لتحسين أداء ال
استخراج العلاقات غير المدعومة من قبل أزواج كيان التجمع التي لها نفس العلاقات في النص. تقوم بعض الأساليب المتنوعة (VAE) المتنوعة (VAE) بتدريب نموذج استخراج العلاقة كترفيه يولد تصنيفات العلاقة. يتم تدريب وحدة فك الترميز جنبا إلى جنب مع التشفير لإعادة ب
تحتوي التعليقات السامة على أشكال لغة غير مقبولة مستهدفة نحو مجموعات أو أفراد.تصبح هذه الأنواع من التعليقات مصدر قلق خطير للمنظمات الحكومية والمجتمعات عبر الإنترنت ومنصات وسائل التواصل الاجتماعي.على الرغم من وجود بعض الأساليب للتعامل مع اللغة غير المق
يجب أن تكون اللغة كجزء كبير من الاتصالات شاملة للمساواة والتنوع. تحتوي لغة مستخدم الإنترنت على تأثير كبير على مستخدمي الأقران في جميع أنحاء العالم. يعبر الناس عن آرائهم من خلال اللغة على المنصات الافتراضية مثل Facebook و Twitter و YouTube وما إلى ذلك