ترغب بنشر مسار تعليمي؟ اضغط هنا

فيديو بمساعدة الحث القوي

Video-aided Unsupervised Grammar Induction

230   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نحن نحقق في الحث القوي بمساعدة الفيديو، والذي يتعلم محلل دائرة من كل من النص غير المستمر والفيديو المقابل له. التركيز الأساليب الموجودة من التعريفي النحوي متعدد الوسائط على تحريض القواعد الناقص من أزواج الصور النصية، مع نتائج واعدة تظهر أن المعلومات من الصور الثابتة مفيدة في الحث. ومع ذلك، توفر مقاطع الفيديو معلومات أكثر ثراء، بما في ذلك الكائنات الثابتة فقط ولكن أيضا إجراءات وتغيرات الدولة مفيدة لتحقيق عبارات الفعل. في هذه الورقة، نستكشف ميزات غنية (على سبيل المثال الإجراء، الكائن، الكائن، المشهد، الصوت، الوجه، التعرف الحر الحر، خطاب الكلام) من مقاطع الفيديو، مع أخذ نموذج PCFG المركب الأخير كناسما أساسيا. نقترح كذلك نموذج PCFG متعدد الوسائط (MMC-PCFG) لتجميع هذه الميزات الغنية بفعالية من طرائق مختلفة. يتم تدريب MMC-PCFG المقترحين على نهاية إلى نهاية ويتفوق على كل طريقة فردية وأنظمة حديثة سابقة على ثلاثة معايير، I.E. Didemo، Youcook2 و MSRVTT، وتؤكد فعالية الاستفادة من معلومات الفيديو للحصول على الحث القوي غير المنشور.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نهدف في هذه الأطروحة إلى التعرف على النشاط البشري من مقطع فيديو. نبدأ بدراسة مرجعية تشمل الطرق والخوارزميات المتّبعة في هذا المجال، وعرض لقواعد البيانات العالمية والطرق المتبعة في الاختبار، ثم ننتقل إلى تصميم نظام للتعرف على النشاط البشري وتنفيذه في بيئة MATLAB.
تهدف اللغة الزمنية الأرضية في مقاطع الفيديو إلى توطين الفترة الزمنية ذات الصلة بالسجن الاستعلام المحدد. الطريقة السابقة تعاملها إما بمهمة الانحدار للحدود أو مهمة استخراج تمتد. ستقوم هذه الورقة بصياغة لغة زمنية تأريض في فهم قراءة الفيديو واقتراح شبكة إعلانات العلاقة (Ranet) لمعالجتها. يهدف هذا الإطار إلى تحديد خيار لحظة فيديو من مجموعة الإجابة المحددة مسبقا بمساعدة Incrse-and-Fine-Query-Query-Quicies Infraction و China- يقترح Interactor Interactor من الاختيار مطابقة المعلومات المرئية والنصية في وقت واحد في مستويات لحظة الجملة ومستويات لحظة الرمز المميز، مما يؤدي إلى تفاعل عبر مشروط خشن وغرامة. علاوة على ذلك، يتم تقديم منشئ علاقة متعددة الخيارات الرواية من خلال الاستفادة من الأزلاء الرسم البياني لالتقاط التبعيات بين خيارات لحظات الفيديو للحصول على أفضل اختيار الخيار. تجارب واسعة النطاق على تصنيف ActivityNet-Campative و Tacos و Charades-Sta تثبت فعالية حلنا. ستكون الرموز متاحة في https://github.com/huntersxsx/ranet.
يقدم هذا البحث دراسة هدفها تحسين أداء آلة درفلة الحديد على الساخن , و جعلها مطابقة للمواصفات الدولية حيث تشمل الدراسة مرحلتين: الأولى و تتضمن النمذجة الرياضية و محاكاة آلة الدرفلة . أما المرحلة الثانية فتشمل تطوير و اختبار نظم التحكم البديلة . اختبر ت صحة هذا النموذج من خلال تحليل منحنيات الأداء المستخلصة من محاكاتها و مقارنتها مع قيم منحنيات و جداول المحطة الحقيقية المأخوذة من HSRMP و ذلك من خلال تضمين هذا النموذج لبارامترات النظام المميزة و المتغيرات الممثلة للأداء الحقيقي للمحطة , هذا يجعل منه أداة مفيدة تتيح محاكاة أداء المحطة , تفسير سلوك المتغيرات و اختبار الحالات إضافة إلى إمكانية تغير العمل و استراتيجيات التشغيل لتحسين التشغيل بشكل عام . من هذا النموذج أنجز التحليل المبدئي و الذي أثبت إمكانية تحسين أداء المحطة بتنفيذ التعديلات التالية : • تقليل قيمة الثابت التكاملي للنماذج المرتبطة بالحلقات المتوضعة في المرحلة الأخيرة • توحيد كل نسب التغذية الردية للحلقات Fed back . • نقل الدائر ليتوضع في المرحلة الأخيرة . ملاحظة : ان الرمز HSRMP هو اختصار للعبارة Hot Strip Rolling Mill Plant و تعني معمل درفلة الحديد على الساخن .
تعتمد الترجمة الآلية عادة على Corpora الموازي لتوفير إشارات متوازية للتدريب.جلبت ظهور الترجمة الآلية غير المنشورة ترجمة آلة بعيدا عن هذا الاعتماد، على الرغم من أن الأداء لا يزال يتخلف عن الترجمة التقليدية للإشراف الآلية.في الترجمة الآلية غير المنشورة ، يسعى النموذج إلى أوجه تشابه لغة متماثلة كمصدر للإشارة الموازية الضعيفة لتحقيق الترجمة.إن نظرية تشومسكي العالمي النجمية تفترض أن القواعد هي شكل فطري من المعرفة للبشر ويحكمها المبادئ والقيود العالمية.لذلك، في هذه الورقة، نسعى إلى الاستفادة من هذه الأدلة القواعد المشتركة لتوفير إشارات متوازية لغة أكثر صراحة لتعزيز تدريب نماذج الترجمة الآلية غير المنشورة.من خلال تجارب على أزواج لغة متعددة النموذجية، نوضح فعالية مناهجنا المقترحة.
تشخيص أمراض الجنب هي واحدة من المشاكل الطبية المتكررة. و على الرغم من توفر مجموعة متنوعة من الاختبارات التشخيصية لتقييم الانصباب الجنبي, لاتزال (15-20٪) من الانصبابات الجنبية دون تشخيص, يأتي دور الجراحة التنظيرية هنا جذرياً و حاسماً بحيث تسمح بدراسة عيانية مباشرة لكامل جوف الجنب، و أخذ خزعات كافية من المناطق المشتبهه. الهدف من الدراسة هو تقييم فعالية و سلامة تنظير الصدر بمساعدة الفيديو في تشخيص أسباب الانصبابات الجنبية . أجرينا خلال 3 سنوات (حزيران 2012 - حزيران 2015 م) 38 تنظيرًا صدرياً بقصد تشخيص انصبابات الجنب الغامضة -(التي لم يُعرف سببها رغم جميع الاستقصاءات غير الباضعة بما فيها بزل و خزعة الجنب عبر الجلد) - و أخذنا خزعات موجهة منها جميعاً. شكلت الآفات الخبيثة في خزعات الجنب (60,5%) ، و التدرن (31,6%) ، و جاءت خزعة الجنب التهابًا لا نوعيًا في باقي الخزعات (7,9%) . تضمنت الآفات الخبيثة: ميزوتليوما (60,9%)، نقائل لسرطانة غدية (30,4%) و لمفوما لا هودجكن (8,7 %). لم تحدث أي وفاة لدى مرضانا، و ظهرت أربع مضاعفات . الخلاصة: تنظير الصدر بمساعدة الفيديو هو إجراء آمن و دقيق لتشخيص و معالجة أمراض الجنب و علاوة على ذلك فإنه يوفر الوقت و الجهد و التكلفة، كما يمكن للمريض أن يتعافى و يعود إلى نشاطه الطبيعي بسرعة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا