ترغب بنشر مسار تعليمي؟ اضغط هنا

المنطقة قيد المناقشة للحوار البصري

Region under Discussion for visual dialog

217   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يفترض أن الحوار المرئي يطلب من محفوظات الحوار إنشاء ردود صحيحة أثناء مربع حوار.ومع ذلك، ليس من الواضح من العمل السابق كيفية حاجة تاريخ حوار الحوار إلى مربع الحوار المرئي.في هذه الورقة، نحدد ما يعنيه سؤال مرئي يحتاج إلى سجل حوار ونصدر مجموعة فرعية من التخمين؟!الأسئلة التي تغير تاريخ حوارهم تماما ردودهم.نقترح تمثيل رواية مفسدية تاريخ حوار حوار بصريا: المنطقة قيد المناقشة.وهو يقيد ميزات الصورة المكانية وفقا لتمثيل الدلالي للتاريخ المستوحى من مفهوم هيكل المعلومات حول السؤال قيد المناقشة. نحن نقيم الهندسة المعمارية على النماذج متعددة الوسائط الخاصة بمهام المهام ونموذج محول البصر lxmert.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الحوار المرئي صعبا لأنه يحتاج إلى الإجابة على سلسلة من الأسئلة المتماسكة بناء على فهم البيئة المرئية. كيفية الأرض الكائنات المرئية ذات الصلة هي واحدة من المشاكل الرئيسية. تستخدم الدراسات السابقة السؤال والتاريخ للحضور في الصورة وتحقيق أداء مرضي، في ح ين أن هذه الطرق ليست كافية لتحديد الكائنات المرئية ذات الصلة دون أي إرشادات. يحظر التأريض غير المناسب للكائنات المرئية أداء نماذج الحوار المرئي. في هذه الورقة، نقترح نهجا جديدا لتعلم الكائنات المرئية البرية للحوار المرئي، والذي يستخدم آلية تأريض كائنات مرئية جديدة حيث يتم استخدام كل من التوزيعات السابقة والخلفية على الكائنات المرئية لتسهيل التأريض البصرية. على وجه التحديد، يتم استنتاج التوزيع الخلفي على الكائنات المرئية من كل من السياق (التاريخ والأسئلة) والأجوبة، وتضمن التأريض المناسب للأشياء المرئية أثناء عملية التدريب. في هذه الأثناء، يتم استخدام توزيع مسبق، الذي يستنتج من السياق فقط، لتقريب التوزيع الخلفي بحيث يمكن أن تكون الكائنات المرئية المناسبة هي التأريض حتى بدون إجابات أثناء عملية الاستدلال. النتائج التجريبية على مجموعة بيانات V0.9 و V1.0 Visdial تثبت أن نهجنا يحسن النماذج القوية السابقة في كل من الإعدادات الإدارية والتمييزية من خلال هامش هامش.
الحوار المرئي هو مهمة الإجابة على سلسلة من الأسئلة التي تأسست في صورة باستخدام سجل الحوار السابق كسياق. في هذه الورقة، ندرس كيفية معالجة تحديين أساسيين لهذه المهمة: (1) التفكير في الهياكل الدلالية الأساسية بين جولات الحوار و (2) تحديد العديد من الإجا بات المناسبة على السؤال المحدد. لمعالجة هذه التحديات، نقترح طريقة لتعليم الرسومات Sparse (SGL) لصياغة مربع حوار مرئي كهزم تعلم هيكل الرسم البياني. ينتشر SGL هياكل الحوار متناثرة بطبيعته من خلال دمج حواف ثنائية وتسهيل وظيفة فقدان هيكلية جديدة. بعد ذلك، نقدم طريقة نقل المعرفة (KT) التي تستخرج تنبؤات الإجابة من نموذج المعلم وتستخدمها باسم ملصقات زائفة. نقترح KT لعلاج أوجه القصور في ملصقات فردية واحدة للحقيقة، والتي تحد بشدة من قدرة نموذج للحصول على إجابات معقولة متعددة. نتيجة لذلك، يحسن نموذجنا المقترح بشكل كبير القدرة على التفكير مقارنة بطرق خط الأساس وتتفوق من الأساليب الحديثة على مجموعة بيانات V1.0 Versdial. يتوفر شفرة المصدر في https://github.com/gicheonkang/sglkt-visdial.
المحادثات غالبا ما تكون في المختبرات والشركات.ملخص أمر حيوي لفهم محتوى مناقشة للأشخاص الذين لم يحضروا المناقشة.إذا تم توضيح الملخص كهيكل وسيطة، فمن المفيد فهم أساسيات المناقشة على الفور.هدفنا في هذه الورقة هو التنبؤ بهيكل رابط بين العقد التي تتكون من الكلام في محادثة: تصنيف كل زوج عقدة إلى مرتبط "أو غير مرتبط." نهج واحد للتنبؤ به الهيكل هو استخدام نماذج تعلم الآلات.ومع ذلك، فإن النتيجة تميل إلى الإفراط في توليد روابط العقد.لحل هذه المشكلة، نقدم طريقة من خطوتين لمهمة التنبؤ الهيكل.نحن نستخدم نهج تعتمد على الجهاز كخطوة الأولى: مهمة تنبؤ الرابط.بعد ذلك، نطبق نهجا يستند إلى النتيجة كخطوة ثانية: مهمة اختيار الارتباط.تحسنت أساليبنا من خطوتين بشكل كبير الدقة مقارنة بطرق خطوة واحدة تستند إلى SVM و BERT.
يمكن أن تستفيد مهام التعلم المختلفة من الوصول إلى معلومات خارجية عن طرائق مختلفة، مثل النص والصور.ركز العمل الحديث على تعلم الهندسة مع ذكريات كبيرة قادرة على تخزين هذه المعرفة.نقترحنا زيادة شبكات عصبية محول التوليد مع وحدات جلب المعلومات المستندة إلى KNN (KIF).تعلم كل وحدة KIF عملية قراءة للوصول إلى المعرفة الخارجية الثابتة.نحن نطبق هذه الوحدات النمطية لنمذجة الحوار المولاد، وهي مهمة صعبة حيث يجب استرجاع المعلومات بشكل مرني وإدماجها للحفاظ على موضوع وتدفق المحادثة.نوضح فعالية نهجنا من خلال تحديد المعرفة ذات الصلة المطلوبة للحوار دراية ولكن المشاركة من Wikipedia، والصور، وإظهار أن الاستفادة من هذه المعلومات المستردة تعمل على تحسين أداء النموذج، ويتم قياسه بواسطة التقييم التلقائي والإنساني.
أجري تقييم تسعة طرز وراثية مدخلة من الفول العادي vicia faba هي: (flip84-59fb, AGUADOLCE LB 1266 SML,، FLIP84-14FB، GIZE. 461, REINA BLANCA، البلدي، القبرصي، الاسباني). خلال موسمي الزراعة (2010-2011 و 2011-2012 (في مزرعة البصة قرب مدينة اللاذقية. لاع تماد المتفوق منها إنتاجيا كأصناف محسنة عالية الإنتاجية في تلك المنطقة، إضافة لاستخدام بقية الطرز المتميزة بصفات معينة كأصول وراثية اعتماداً على الصفات التي تتفوق بها على الطرز المحلية لإدخالها في برامج تربية مستقبلاً. أشارت نتائج الدراسة إلى وجود فروقات معنوية بين صفات الطرز المدروسة حيث تفوق الطراز الاسباني على جميع الطرز المدروسة بطول القرن (17.16 سم)، و ترافق ذلك مع درجة توريث عالية (68.24) تلاه الطرازfilp84-59fb (15.1 سم)، و بوزن البذور بالقرن الواحد (33.6غ)، و ذلك مع درجة توريث عالية (68.45) يليه الطراز القبرصي بوزن البذور بالقرن الواحد (14.66غ)، و بعدد البذور بالقرن (4.6)، و ترافق ذلك مع درجة توريث منخفضة (23.53) تلاه الطرز (البلدي، و القبرصي، و aguadolce.lb1266، و filip84-14fb) بعدد البذور بالقرن (3.6). تميز الطراز القبرصي على جميع الطرز بوزن القرن (23.43غ)، و تزامن ذلك مع درجة توريث عالية (76.45)، و بوزن البذرة الواحدة (3.93غ)، و ذلك مع درجة توريث عالية (54.82)، يليه الطراز الاسباني بوزن القرن (20.63غ)، ثم الطراز filip84-59fb بوزن البذرة الواحدة (3.73غ)، و بوزن 100 بذرة (401غ)، و ترافق ذلك مع درجة توريث عالية (97.49) يليه aguadolce.lb بوزن 100 بذرة (285غ)، و كان الطراز sml أكثر الأصناف تبكيرا حيث بلغ عدد الأيام حتى الأزهار (46 يوم) و النضج (148 يوم) يليه الطراز القبرصي (51 يوم) للإزهار و الطرازflip84-59fb (155 يوم) للنضج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا