نحن نهدف إلى تحديد أسباب العمل البشري تلقائيا في مقاطع الفيديو عبر الإنترنت.نحن نركز على النوع الواسع من Lifestyle Vlogs، حيث يقوم الأشخاص بإجراء أعمال بينما يصفهم لفظيا.نقدم وجعلها متاحة للجمهور DataSet Whyact، والتي تتكون من 1،077 إجراء بصري مشروح يدويا مع أسبابها.نحن تصف نموذج متعدد الوسائط يرفع المعلومات المرئية والنصية إلى الاستفادة تلقائيا الأسباب المقابلة للعمل المقدم في الفيديو.
We aim to automatically identify human action reasons in online videos. We focus on the widespread genre of lifestyle vlogs, in which people perform actions while verbally describing them. We introduce and make publicly available the WhyAct dataset, consisting of 1,077 visual actions manually annotated with their reasons. We describe a multimodal model that leverages visual and textual information to automatically infer the reasons corresponding to an action presented in the video.
المراجع المستخدمة
https://aclanthology.org/
إذا لم يكن متشققاً فإنه لا يعمل. إن هذه العبارة نتيجة حتمية لعدم تساوي مقاومة الشد للخرسانة، مع مقاومة الشد للفولاذ في عناصر المنشآت الخرسانية، و المصممة بشكل اقتصادي.
و بالرغم من ذلك فإنه نادراً ما يستخدمها المهندس المصمم لتبرير حادثة تشقق في مبنى،
تبحث هذه الدراسة في الأسباب التي تقف وراء ضعف طلبة قسم اللغة
الإنجليزية و آدابها في جامعة فيلادلفيا. و أود أن أبين في بداية ورقتي أن ملاحظاتي و النتائج التي توصلت إليها مبنية على خبرتي الشخصية التي حصلت عليها من خلال عملي في تعليم اللغة الإنجليزية ف
في السنوات الأخيرة، اكتسب التسوق عبر الإنترنت زخما وأصبح مكانا مهما للعملاء الذين يرغبون في توفير الوقت وتبسيط عملية التسوق الخاصة بهم. إن ميزة أساسية للتسوق عبر الإنترنت هي القدرة على قراءة ما يقوله العملاء الآخرون حول منتجات الاهتمام. في هذا العمل،
إن الاستدلال اللغوي الطبيعي (NLI) هي مهمة تحديد ما إذا كان جزء من النص ينطوي أو يتناقض أو لا علاقة له بقطعة أخرى من النص.في هذه الورقة، نحقق في كيفية ندف الاستنتاجات المنهجية (أي، العناصر التي يتفق بها الناس على تسمية NLI) بصرف النظر عن عناصر الخلاف
التناقضات موجودة بين الثقافات أو اللغات المختلفة.قد يؤدي الافتقار إلى التفاهم المتبادل بين المجموعات المختلفة المختلفة حول وجهات النظر حول قيم أو أحداث محددة إلى قرارات غير مطلع أو آراء متحيزة.وبالتالي، فإن فهم وجهات نظر المجموعة تلقائيا يمكن أن توفر