ترغب بنشر مسار تعليمي؟ اضغط هنا

تقول صورة متحركة ألف كلمة على الأقل: تحديد ردود GIF المستندة إلى GIF في مربع حوار MultiModal

An animated picture says at least a thousand words: Selecting Gif-based Replies in Multimodal Dialog

209   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المحادثات عبر الإنترنت تشمل أكثر من مجرد نص.على نحو متزايد، تعمل الاستجابات القائمة على الصور مثل الميمات وحلويات الرسوم المتحركة استجابات معترف بها ثقافيا وغالبا ما تكون روح الدعابة في المحادثة.ومع ذلك، في حين أن NLP تم توسيعها إلى نماذج متعددة الوسائط، فإن أنظمة حوار المحادثة تركز إلى حد كبير على توليد الردود النصية فقط.هنا، نقدم مجموعة بيانات جديدة تبلغ 1.56 مليون محادثة Text-GIF تتحول وإدخال نموذج محادثة متعددة الوسائط جديد Pepe جمبري الملك لتحديد الردود القائمة على GIF.نوضح أن نموذجنا ينتج استجابات GIF ذات الصلة وعالية الجودة، وفي تجربة مراقبة عشوائية كبيرة ترد على المستخدمين الحقيقيين، نظين على أن ردودنا النموذجية لدينا مع صور متحركة يتم استلامها بشكل أفضل من قبل المجتمع.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن إيماءات المتكلم تعاون معبرة من الكلام وخدمة وظائف عملية مختلفة لمرافقة طريقة الفم. لذلك، فإن الإيماءات جزء لا يتجزأ من نظام اللغة: قد يضيفون وضوحا للخطال، ويمكن استخدامها لتسهيل استرجاع المعجمات والاحتفاظ بدوره في المحادثات، والمساعدة في لفظي المح توى الدلالي وتسهيل المتحدثين في الخروج بكلمات يعتزمونها قل. هذا الجانب مناسب بشكل خاص في الخطاب السياسي، حيث يحاول المتحدثون تطبيق استراتيجيات الاتصال التي تكون واضحة ومقنعة باستخدام الإشارات اللفظية وغير اللفظية. في هذه الورقة، نحقق في إيماءات الكلام المشارك للعديد من السياسيين الإيطاليين خلال مقابلات وجها لوجه باستخدام نهج لغوي متعدد الوسائط. نحن أولا إثراء كوربوس موجودة مع طبقة توضيحية جديدة تلتقط وظيفة حركات اليد. بعد ذلك، نقوم بإجراء تحليل للجعة، مع التركيز بشكل خاص على العلاقة بين حركات اليد وطبقات المعلومات الأخرى مثل الحزب السياسي أو العلامات غير المعجمية وشبه المعجمية. نلاحظ أن الاختلافات المسجلة تتعلق بالسياسيين الفرديين أكثر من الحزب الذي ينتمون إليه، وهذه حركات اليد تميل إلى حدوثها بشكل متكرر مع الظواهر شبه المعجمية، مما يدعم فرضية الاسترجاع المعجمية.
العديد من الأعمال الحديثة في إظهار كلمة التحليل المعجمي ثنائي اللغة (BLI) Word Adgetdings كمنتجات في الفضاء Euclidean.على هذا النحو، يتم حلها عادة من خلال العثور على تحول خطي يقوم بخرائط Ageddings إلى مساحة مشتركة.بدلا من ذلك، قد تكون مفهومة Word Age ddings كما العقد في رسم بياني مرجح.هذا الإطار يتيح لنا فحص حي الرسم البياني للعقدة دون تولي التحول الخطي، ويستغل التقنيات الجديدة من أدب الأمثل في مطابقة الرسم البياني.لم تتم مقارنة هذه الأساليب المتناقضة في Bli حتى الآن.في هذا العمل، ندرس سلوك الأساليب Euclidean مقابل الأساليب القائمة القائم على الرسم البياني إلى Bli تحت شروط البيانات المختلفة وإظهار أنها تكمل بعضها البعض عند الجمع.نطلق سردنا في https://github.com/kellymarchisio/euc-v-graph-bli.
التنسيق هو ظاهرة اللغة التي تصدر شرطين أو أكثر من العبارات أو العبارات باستخدام التنسيق. على الرغم من أن التنسيق قد تم استكشافه على نطاق واسع في أدب اللغويات، فإن القواعد والقيود التي تحكم هيكلها لا تزال بعيد المنال إلى حد كبير وناقشت على نطاق واسع ب ين اللغويين. تقدم هذه الورقة دراسة لوجود تنسيقات على عكس المدىين على وجه الخصوص، حيث يشكل الزوجان من عبارة التنسيق مكونا صالحين ولكن لديهم فئات مميزة. أجرينا تحليلا نصنيا لفئات الجمل الفعلية التي يمكن ارتباطها في مثل هذه التنسيقات على عكس ذلك من خلال نهج محاسبي قائم على الكائنات الحاسوبية، باستخدام كوربوس اللغة الإنجليزية الأمريكية المعاصرة (COCA) كمصدر بيانات رئيسي، بالإضافة إلى بنك بنسار (PTB) وبعد تظهر النتائج أن اثنين من الالتحاق داخل التنسيقات على عكس عرض خصائص مختلفة بناء على موقفها، ودعم عرض مضاد للتنسيق لهيكل التنسيق. يوفر هذا البحث بيانات ووجهات نظر جديدة من خلال استخدام التقنيات الإحصائية التي يمكن أن تساعد في تشكيل نظريات ونماذج التنسيق في المستقبل.
نحن نركز على نماذج الحوار في سياق الدراسات السريرية حيث الهدف هو المساعدة في جمع، بالإضافة إلى المعلومات الوثيقة التي تم جمعها بناء على استبيان معلومات صريحة ذات صلة طبيا.لتعزيز مشاركة المستخدم وعنوان هذا الهدف المزدوج (جمع مجموعة من نقاط البيانات ال محددة مسبقا ومعلومات غير رسمية حول حالة المرضى)، نقدم نموذج فرعي مصنوع من ثلاثة برادات: قائمة على المهام ومتابعة وبوت اجتماعي.نقدم طريقة عامة لتطوير روبوتات المتابعة.نحن نقارن تكوينات الفرقة المختلفة ونؤثر أن مزيج من الروبوتات الثلاثة (I) يوفر أساسا أفضل لجمع المعلومات من مجرد المعلومات التي تبحث عن الروبوت و (2) بجمع المعلومات بطريقة أكثر سهولة الاستخدام بطريقة أكثر فاعلية بحيث تكون فرقةنموذج يجمع بين المعلومات التي تبحث عنها والروبوت الاجتماعي.
تهدف مهمة التحقق من الحقائق القائمة على الطاولة إلى التحقق مما إذا كان البيان المحدد مدعوم من الجدول شبه المنظم المحدد. يلعب المنطق الرمزي مع العمليات المنطقية دورا حاسما في هذه المهمة. الأساليب الحالية الاستفادة من البرامج التي تحتوي على معلومات منط قية غنية لتعزيز عملية التحقق. ومع ذلك، نظرا لعدم وجود إشارات خاضعة للإشراف بالكامل في عملية توليد البرنامج، يمكن استخلاص البرامج الزائفة وعملها، مما يؤدي إلى عدم قدرة النموذج على العمليات المنطقية المفيدة. لمعالجة المشكلات المذكورة أعلاه، في هذا العمل، نقوم بصياغة مهمة التحقق من الحقائق القائمة على الطاولة كإطار لاسترجاع الأدلة والتفكير، حيث اقترح شبكة التحقق من الأدلة على مستوى المنطق وشبكة التحقق القائمة على الرسم البياني (LERGV). على وجه التحديد، نقوم أولا باسترجئة الأدلة التي تشبه البرامج على مستوى المنطق من الجدول المعطى والبيان كدليل تكميلي على الطاولة. بعد ذلك، نقوم بإنشاء رسم بياني لمستوى منطقي لالتقاط العلاقات المنطقية بين الكيانات والوظائف في الأدلة المستردة، وتصميم شبكة التحقق القائمة على الرسم البياني لإجراء المنطق المستندة إلى الرسم البياني على مستوى المنطق بناء على الرسم البياني الذي تم إنشاؤه لتصنيف النهائي علاقة استقامة. النتائج التجريبية على Tabract Tabract القياسي على نطاق واسع تظهر فعالية النهج المقترح.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا