نقترح أن نقترح Captioner أخبار البصرية، وهو نموذج كيائن كيائن لمهمة تقسيم صورة الأخبار. نقدم أيضا Visual News، وهو معيار واسع النطاق يتكون من أكثر من مليون صورة إخبارية إلى جانب المقالات الإخبارية المرتبطة، وتستياؤ الصور، ومعلومات المؤلف، والبيانات الوصفية الأخرى. على عكس مهمة تقسيم الصور القياسية، تصور الصور الأخبار المواقف التي يكون فيها الأشخاص والمواقع والأحداث ذات أهمية قصوى. يمكن أن تجمع طريقةنا المقترحة بشكل فعال بين الميزات المرئية والنصية لتوليد التسميات التوضيحية مع معلومات أكثر ثراء مثل الأحداث والكيانات. وبشكل أكثر تحديدا، تم تصميمها على بنية المحولات، يتم تزويد نموذجنا بمزيد من المجهز بتقنيات الانصهار متعددة الوسائط على الرواية وآليات الاهتمام، والتي تم تصميمها لتوليد كيانات اسمه أكثر دقة. تستخدم طريقتنا معلمات أقل بكثير مع تحقيق نتائج تنبؤ أفضل قليلا من الأساليب المنافسة. توضح مجموعة بيانات الأخبار المرئية الأكبر والأكثر تنوعا التحديات المتبقية في تصوير الصور الإخبارية.
We propose Visual News Captioner, an entity-aware model for the task of news image captioning. We also introduce Visual News, a large-scale benchmark consisting of more than one million news images along with associated news articles, image captions, author information, and other metadata. Unlike the standard image captioning task, news images depict situations where people, locations, and events are of paramount importance. Our proposed method can effectively combine visual and textual features to generate captions with richer information such as events and entities. More specifically, built upon the Transformer architecture, our model is further equipped with novel multi-modal feature fusion techniques and attention mechanisms, which are designed to generate named entities more accurately. Our method utilizes much fewer parameters while achieving slightly better prediction results than competing methods. Our larger and more diverse Visual News dataset further highlights the remaining challenges in captioning news images.
المراجع المستخدمة
https://aclanthology.org/
مهمة تقصير صورة المقال الإخباري يهدف إلى توليد تعليق وصفية وغنية بالمعلومات لصور المقالة الإخبارية.على عكس التسميات التوضيحية التقليدية التي تصف ببساطة محتوى الصورة بمصطلحات عامة، تتبع تعليق الصور الإخبارية إرشادات صحفية وتعتمد اعتمادا كبيرا على الكي
شهدت السنوات القليلة الماضية زيادة هائلة في كمية وتأثير التضاعف الذي ينتشر عبر الإنترنت. تم تطوير نهج مختلفة لاستهداف العملية في مراحل مختلفة من تحديد مصادر لتتبع التوزيع في وسائل التواصل الاجتماعي لتوفير Debunks المتابعة للأشخاص الذين واجهوا التضليل
نقترح خلاصات الأخبار المفتوحة، ونحن مؤلف أخبار مفتوحة يدعم المهام المختلفة المتعلقة بنية الحاليات في الافتتاحيات الإخبارية، مع التركيز على اكتشاف المنظور التلقائي. أخبار الافتتاحية هي نوع من النص المقنع، حيث يكون بنية الحجة ضمنية عادة. ومع ذلك، فإن ا
نقدم إطار منتقدي الممثل للحث على الهياكل الفرعية في مقال إخباري لمجموع خطاب الأخبار.يستخدم النموذج منتقدين متعددين يتصرفون وفقا لهياكل رشية معروفة بينما يهدف الممثل إلى تفوقها.تشكل هياكل المحتوى جمل تمثل حدود رائعة كامنة.ثم، نقدم شبكة عصا هرمية تستخد
في حين أن لقاحات CoviD-19 أصبحت متاحة في النهاية على نطاق واسع، فإن الوباء الثاني الذي يدور حول تداول الأخبار المضادة ل Vaxxer وهمية "قد يعيق الجهود للتعافي من أول واحد.مع وضع ذلك في الاعتبار، أجرينا تحليلا مكثفا للعقائز العربية والإنجليزية حول لقاحا