ترغب بنشر مسار تعليمي؟ اضغط هنا

أخبار البصرية: المعيار والتحديات في أخبار الصورة التسمية

Visual News: Benchmark and Challenges in News Image Captioning

328   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح أن نقترح Captioner أخبار البصرية، وهو نموذج كيائن كيائن لمهمة تقسيم صورة الأخبار. نقدم أيضا Visual News، وهو معيار واسع النطاق يتكون من أكثر من مليون صورة إخبارية إلى جانب المقالات الإخبارية المرتبطة، وتستياؤ الصور، ومعلومات المؤلف، والبيانات الوصفية الأخرى. على عكس مهمة تقسيم الصور القياسية، تصور الصور الأخبار المواقف التي يكون فيها الأشخاص والمواقع والأحداث ذات أهمية قصوى. يمكن أن تجمع طريقةنا المقترحة بشكل فعال بين الميزات المرئية والنصية لتوليد التسميات التوضيحية مع معلومات أكثر ثراء مثل الأحداث والكيانات. وبشكل أكثر تحديدا، تم تصميمها على بنية المحولات، يتم تزويد نموذجنا بمزيد من المجهز بتقنيات الانصهار متعددة الوسائط على الرواية وآليات الاهتمام، والتي تم تصميمها لتوليد كيانات اسمه أكثر دقة. تستخدم طريقتنا معلمات أقل بكثير مع تحقيق نتائج تنبؤ أفضل قليلا من الأساليب المنافسة. توضح مجموعة بيانات الأخبار المرئية الأكبر والأكثر تنوعا التحديات المتبقية في تصوير الصور الإخبارية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

مهمة تقصير صورة المقال الإخباري يهدف إلى توليد تعليق وصفية وغنية بالمعلومات لصور المقالة الإخبارية.على عكس التسميات التوضيحية التقليدية التي تصف ببساطة محتوى الصورة بمصطلحات عامة، تتبع تعليق الصور الإخبارية إرشادات صحفية وتعتمد اعتمادا كبيرا على الكي انات المسماة لوصف محتوى الصورة، غالبا ما يرسم السياق من المقالة بأكملها.في هذا العمل، نقترح نهجا جديدا لهذه المهمة، بدافع من إرشادات التسمية التوضيحية التي يتبعها الصحفيون.نهجنا، المبادئ التوجيهية الصحفية تدرك صورة أخبار التسمية التوضيحية (Joganic)، ترفد بنية التسميات التوضيحية لتحسين جودة الجيل وتوجيه تصميم التمثيل الخاص بنا.النتائج التجريبية، بما في ذلك دراسات التفصيل التفصيلية، على مجموعة من مجموعات بيانات واسعة النطاق للجمهورية على نطاق واسع أن جوجاني يتفوق بشكل كبير على الأساليب الحديثة على حد سواء على جيل التسمية التوضيحية ومقاييس الكيانية المسمى.
شهدت السنوات القليلة الماضية زيادة هائلة في كمية وتأثير التضاعف الذي ينتشر عبر الإنترنت. تم تطوير نهج مختلفة لاستهداف العملية في مراحل مختلفة من تحديد مصادر لتتبع التوزيع في وسائل التواصل الاجتماعي لتوفير Debunks المتابعة للأشخاص الذين واجهوا التضليل . أحد الاستنتاجات الشائعة في كل من هذه الأساليب هو أن التضليل محكوم للغاية وموضوعي موضوعي للحلول الآلية بالكامل للعمل ولكن كمية البيانات المعالجة والرجوع إليها مرتفعة للغاية بالنسبة للبشر للتعامل معهم. في النهاية، تدعو المشكلة إلى نهج هجين لخبراء البشر مع المساعدة التكنولوجية. في هذه الورقة، سنقوم بتظهر تطبيق تقنيات معينة من أحدث تقنيات NLP في مساعدة Debunkers الخبراء ودخري الحقائق بالإضافة إلى دور خوارزميات NLP هذه في اتباع نهج أكثر شمولا لتحليل ومكافحة انتشار التضليل. سنقدم وجعة متعددة اللغات من التضليل والضغطات التي تحتوي على نص وعلامات مفاهيم وصور ومقاطع فيديو بالإضافة إلى طرق مختلفة للبحث والاستفادة من المحتوى.
نقترح خلاصات الأخبار المفتوحة، ونحن مؤلف أخبار مفتوحة يدعم المهام المختلفة المتعلقة بنية الحاليات في الافتتاحيات الإخبارية، مع التركيز على اكتشاف المنظور التلقائي. أخبار الافتتاحية هي نوع من النص المقنع، حيث يكون بنية الحجة ضمنية عادة. ومع ذلك، فإن ا لحجج المقدمة في افتتاحية عادة مركز حول أطروحة موجزة مركزة، والتي نشير إليها كمنظورهم. تهدف Multioped إلى دعم دراسة مهام متعددة ذات صلة باكتشاف المنظور التلقائي، حيث من المتوقع أن ينتج النظام عبارة أطروحة واحدة الجملة التي تلخص الحجج المقدمة. نقول أن تحديد ومخلص من وجهات نظر اللغة الطبيعية من الافتتاحيات هو خطوة حاسمة نحو دراسة هيكل الجدال الضمني في الأخبار الافتتاحية. نناقش أولا التحديات وتحديد عدد قليل من المهام المفاهيمية تجاه هدفنا. لإظهار فائدة المهام متعددة المنصوص عليها، ندرس مشكلة تلخيص المنظور في بيئة تعليمية متعددة المهام، كدراسة حالة. نظرا لأنه، مع المهام المستحثة كامرأة مساعدة، يمكننا تحسين جودة ملخص المنظور الذي تم إنشاؤه. نأمل أن يكون multiopeded موردا مفيدا للدراسات المستقبلية عن الجدال في مجال تحرير الأخبار.
نقدم إطار منتقدي الممثل للحث على الهياكل الفرعية في مقال إخباري لمجموع خطاب الأخبار.يستخدم النموذج منتقدين متعددين يتصرفون وفقا لهياكل رشية معروفة بينما يهدف الممثل إلى تفوقها.تشكل هياكل المحتوى جمل تمثل حدود رائعة كامنة.ثم، نقدم شبكة عصا هرمية تستخد م الجمل الحدودية الرواعية المحددة إلى نموذج التفاعل متعدد المستويات بين الجمل والسلطة الفرعية والوثيقة.يظهر النتائج التجريبية والتحليلات في Corpiscours على أن نموذج الممثل يتعلم بتفصيل وثيقة بفعالية وثيقة إلى فرعية وتحسين أداء النموذج الهرمي في مهمة تنميط الخطاب الأخبار.
في حين أن لقاحات CoviD-19 أصبحت متاحة في النهاية على نطاق واسع، فإن الوباء الثاني الذي يدور حول تداول الأخبار المضادة ل Vaxxer وهمية "قد يعيق الجهود للتعافي من أول واحد.مع وضع ذلك في الاعتبار، أجرينا تحليلا مكثفا للعقائز العربية والإنجليزية حول لقاحا ت CovID-19، مع التركيز على الرسائل المنصولة من قطر.وجدنا أن التغريدات العربية تحتوي على الكثير من المعلومات والشائعات الخاطئة، في حين أن تغريدات اللغة الإنجليزية هي في الغالب واقعية.ومع ذلك، فإن تغريدات اللغة الإنجليزية هي أكثر إثارةا من اللغة العربية.فيما يتعلق بتقنيات الدعاية، فإن حوالي نصف التغريدات العربية تعبر عن الشك، و 1/5 استخدام اللغة المحملة، في حين أن تغريدات اللغة الإنجليزية وفيرة في اللغة المحملة، المبالغة، والخوف، والسمطية بالاسم، والشك، والتلويح العلمي.أخيرا، من حيث التأطير، تعتمد تغريدات عربية منظور صحية وسلامة، بينما تهيمن في المخاوف الاقتصادية الإنجليزية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا