ترغب بنشر مسار تعليمي؟ اضغط هنا

متعددة المنصوص عليها: كائنات افتتاحية أخبار متعددة المنظور

MultiOpEd: A Corpus of Multi-Perspective News Editorials

290   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح خلاصات الأخبار المفتوحة، ونحن مؤلف أخبار مفتوحة يدعم المهام المختلفة المتعلقة بنية الحاليات في الافتتاحيات الإخبارية، مع التركيز على اكتشاف المنظور التلقائي. أخبار الافتتاحية هي نوع من النص المقنع، حيث يكون بنية الحجة ضمنية عادة. ومع ذلك، فإن الحجج المقدمة في افتتاحية عادة مركز حول أطروحة موجزة مركزة، والتي نشير إليها كمنظورهم. تهدف Multioped إلى دعم دراسة مهام متعددة ذات صلة باكتشاف المنظور التلقائي، حيث من المتوقع أن ينتج النظام عبارة أطروحة واحدة الجملة التي تلخص الحجج المقدمة. نقول أن تحديد ومخلص من وجهات نظر اللغة الطبيعية من الافتتاحيات هو خطوة حاسمة نحو دراسة هيكل الجدال الضمني في الأخبار الافتتاحية. نناقش أولا التحديات وتحديد عدد قليل من المهام المفاهيمية تجاه هدفنا. لإظهار فائدة المهام متعددة المنصوص عليها، ندرس مشكلة تلخيص المنظور في بيئة تعليمية متعددة المهام، كدراسة حالة. نظرا لأنه، مع المهام المستحثة كامرأة مساعدة، يمكننا تحسين جودة ملخص المنظور الذي تم إنشاؤه. نأمل أن يكون multiopeded موردا مفيدا للدراسات المستقبلية عن الجدال في مجال تحرير الأخبار.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الطريقة التي يتم إنشاؤها ونشرها قد تغيرت بشكل كبير خلال العقد الماضي.إن تحديد المنظور السياسي يشكل طريقة مناقشة الأحداث المناقشة في وسائل الإعلام أكثر أهمية بسبب الزيادة الحادة في عدد منافذ الأخبار والمقالات.الأساليب السابقة عادة ما تستفيد فقط المعلو مات اللغوية.ومع ذلك، فإن المقالات الإخبارية تحاول الحفاظ على المصداقية ويبدو أنها محايدة.لذلك، يتم تقديم التحيز بطرق خفية، عادة من خلال التركيز على جوانب مختلفة من القصة.في هذه الورقة، نقترح إطارا جديدا يعتبر الكيانات المذكريات في المقالات الإخبارية والمعرفة الخارجية بها، مما أسفر عن التحيز فيما يتعلق بهذه الكيانات.نستكشف طرق مختلفة لحقن معلومات الكيان في نموذج النص.تظهر التجارب أن إطار عملنا المقترح يحقق تحسينات كبيرة على النماذج النصية القياسية، وهو قادر على تحديد الفرق في روايات الأخبار مع وجهات نظر مختلفة.
كان الحمل الزائد المعلومات أحد التحديات المتعلقة بالمعلومات من الإنترنت. إنها ليست مسألة وصول المعلومات، بدلا من ذلك، تحول التركيز نحو جودة البيانات المستردة. لا سيما في مجال الأخبار، تقرير منافذ متعددة عن أحداث الأخبار نفسها ولكن قد يختلف في التفاصي ل. يعتبر هذا العمل أن منافذ أخبار مختلفة من المرجح أن تختلف في أساليب الكتابة واختيار الكلمات، وتقترح طريقة لاستخراج الجمل بناء على معلوماتها الرئيسية من خلال التركيز على المرادفات المشتركة في كل جملة. تحاول طريقتنا أيضا تقليل التكرار من خلال التجميع الهرمي وترتيب جمل مختارة على TransBert المقترحة. تشير النتائج إلى أن الإطار المقترح غير المعدل بنجاح يحسن التغطية والتماسك، وفي الوقت نفسه، يقلل من التكرار للحصول على ملخص تم إنشاؤه. علاوة على ذلك، نظرا لعملية الحصول على DataSet، نقترح أيضا طريقة تحسين البيانات لتخفيف مشاكل النصوص غير المرغوب فيها، والتي تنجم عن عملية تجريف تلقائي.
السجلات غير الرسمية والمحايدة واللغة الرسمية ملموسة للغاية في إنتاج خطاب.ومع ذلك، ما زالوا مدروسين بشكل سيئ في معالجة اللغة الطبيعية (NLP)، وخاصة خارج اللغة الإنجليزية، ولأنواع نصية جديدة مثل التغريدات.لتحفيز البحث، تقدم هذه الورقة كجن كبير قدره 228، 505 تغريدات فرنسية (6M كلمات) مشروح في سجلات اللغة.يتم توفير التسميات من قبل مصنف كاممبرت متعدد الملصقات المدربة وتحقق من مجموعة فرعية مشروحة يدويا من Corpus، في حين يتم تحديد التغريدات لتجنب التحيزات غير المرغوب فيها.بناء على Corpus، يتم توفير تحليل أولي للسمات اللغوية من النحاذج البشرية أو الاستخراج التلقائي لوصف Corpus وتمهيد الطريق لمكاميات NLP المختلفة.تتوفر Corpus، دليل التوضيحية والتصنيف على http://tremolo.irisa.fr.
نقترح أن نقترح Captioner أخبار البصرية، وهو نموذج كيائن كيائن لمهمة تقسيم صورة الأخبار. نقدم أيضا Visual News، وهو معيار واسع النطاق يتكون من أكثر من مليون صورة إخبارية إلى جانب المقالات الإخبارية المرتبطة، وتستياؤ الصور، ومعلومات المؤلف، والبيانات ا لوصفية الأخرى. على عكس مهمة تقسيم الصور القياسية، تصور الصور الأخبار المواقف التي يكون فيها الأشخاص والمواقع والأحداث ذات أهمية قصوى. يمكن أن تجمع طريقةنا المقترحة بشكل فعال بين الميزات المرئية والنصية لتوليد التسميات التوضيحية مع معلومات أكثر ثراء مثل الأحداث والكيانات. وبشكل أكثر تحديدا، تم تصميمها على بنية المحولات، يتم تزويد نموذجنا بمزيد من المجهز بتقنيات الانصهار متعددة الوسائط على الرواية وآليات الاهتمام، والتي تم تصميمها لتوليد كيانات اسمه أكثر دقة. تستخدم طريقتنا معلمات أقل بكثير مع تحقيق نتائج تنبؤ أفضل قليلا من الأساليب المنافسة. توضح مجموعة بيانات الأخبار المرئية الأكبر والأكثر تنوعا التحديات المتبقية في تصوير الصور الإخبارية.
تهدف الكشف عن العلاقات متعددة القفزات في أسئلة المعرفة الإجابة (KBQA) إلى استرجاع مسار العلاقة بدءا من كيان الموضوع إلى عقدة الإجابة بناء على سؤال معين، حيث قد يشتمل مسار العلاقة على علاقات متعددة. تعامل معظم الأساليب الموجودة بمثابة مشكلة في تعلم ال علامة الفردية مع تجاهل حقيقة أنه بالنسبة لبعض الأسئلة المعقدة، توجد مسارات علاقة صحيحة متعددة في قواعد المعرفة. لذلك، في هذه الورقة، يعتبر اكتشاف العلاقة المتعددة القفز مشكلة في التعلم متعدد العلامات. ومع ذلك، فإن إجراء اكتشاف علاقة متعددة الأقفز متعددة الملصقات يمثل تحديا لأن أعداد كل من الملصقات والقفزات غير معروفة. لمعالجة هذا التحدي، يتم صياغة الكشف المتعدد الملصقات متعددة القفز كهجوم توليد التسلسل. يقترح نموذج توليد علاقات العلاقة بين العلاقة على حل المشكلة بطريقة نهاية إلى نهاية. تظهر النتائج التجريبية فعالية الطريقة المقترحة للكشف عن العلاقة و KBQA.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا