تعتبر عمليات تبادل الوسائط جزءا مهما في الاتصال، لكننا غالبا ما غمرت كثيرا مع الكثير من الحجج لمراكز مختلفة أو يتم التقاطها في فقاعات المرشح.الأدوات التي يمكن أن تقدم حجج قوية ذات صلة بالنفس يمكن أن تساعد في تقليل هذه المشاكل.لتكون قادرا على تقييم الخوارزميات التي يمكن أن تتنبأ بمدى مقنع الحجة، قمنا بجمع مجموعة بيانات بها أكثر من 900 حجج ومواقف شخصية تضم 600 فرد، والتي نقدمها في هذه الورقة.بناء على هذه البيانات، نقترح ثلاثة مهام توصية، التي نقدم النتائج التي نقدمها خطين أساسيين من مصنف أغلبية بسيطة وخوارزمية جارتين أكثر تعقيدا.تشير نتائجنا إلى أنه لا يزال من الممكن تطوير خوارزميات أفضل، وندعنا المجتمع لتحسين نتائجنا.
Exchanging arguments is an important part in communication, but we are often flooded with lots of arguments for different positions or are captured in filter bubbles. Tools which can present strong arguments relevant to oneself could help to reduce those problems. To be able to evaluate algorithms which can predict how convincing an argument is, we have collected a dataset with more than 900 arguments and personal attitudes of 600 individuals, which we present in this paper. Based on this data, we suggest three recommender tasks, for which we provide two baseline results from a simple majority classifier and a more complex nearest-neighbor algorithm. Our results suggest that better algorithms can still be developed, and we invite the community to improve on our results.
المراجع المستخدمة
https://aclanthology.org/
تصفيات مضادة تصف الأحداث التي لم تتم أو لا يمكنها إجراءها. نحن نعتبر مشكلة الكشف المتعرضين (CFD) في مراجعات المنتج. لهذا الغرض، فإننا نحيطر على مجموعة بيانات متعددة اللغات CFD من مراجعات منتجات الأمازون التي تغطي البيانات الإضافية المكتوب باللغات الإ
تحديد مصطلحات المصطلحات هي الخطوة الأولى في التواصل العلمي. يمكن تطوير نماذج توليد النص العصبي لتوليد التعريف التحايل على منحك كثافة العمل، مما يؤدي إلى مزيد من تسريع الاكتشاف العلمي. لسوء الحظ، فإن الافتقار إلى مجموعة بيانات تعريف المصطلحات واسعة ال
في ترجمة النص حيث تعتبر المشاعر الرسالة الرئيسية، يعطي المترجمون البشريون اهتماما خاصا للكلمات تحمل المعنويات. السبب هو أن ترجمة غير صحيحة لهذه الكلمات سوف تفوت الجانب الأساسي للنص المصدر، أي شعور المؤلف. في العالم عبر الإنترنت، تستخدم أنظمة MT على ن
نقوم بتقديم Gerdalir، مجموعة بيانات ألمانية لاسترجاع المعلومات القانونية بناء على وثائق الحالة من منصة المعلومات القانونية المفتوحة المفتوحة.تتكون DataSet من استفسارات 123 ألفا، يتم تصنيف كل منها وثيقة واحدة ذات صلة على الأقل في مجموعة من وثائق الحال
تصف هذه الورقة عملية التوضيحية لبيانات لغة مسيئة محددة لرومانية على وسائل التواصل الاجتماعي.لتسهيل البحوث القابلة للمقارنة متعددة اللغات حول اللغة الهجومية، تتبع المبادئ التوجيهية التوضيحي بعض جهود التوضيح الحديثة لغات أخرى.يحتوي Corpus النهائي على 5