ترغب بنشر مسار تعليمي؟ اضغط هنا

اسأل ما هو مفقود وما هو مفيد: تحسين توضيح سؤال التوضيح باستخدام المعرفة العالمية

Ask what's missing and what's useful: Improving Clarification Question Generation using Global Knowledge

442   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن القدرة على توليد أسئلة التوضيح I.E.، أسئلة تحدد المعلومات المفقودة المفيدة في سياق معين، مهمة في الحد من الغموض.يستخدم البشر تجربة سابقة مع سياقات مماثلة لتشكيل وجهة نظر عالمية ومقارنين السياق المعدد للتأكد من مفقود وما هو مفيد في السياق.مستوحاة من ذلك، نقترح نموذجا لتدوين سؤال التوضيح حيث نحدد أولا ما هو مفقود عن طريق اختلاف الفرق بين المنظر العالمي والمحلي ثم تدريب نموذج لتحديد ما هو مفيد وتوليد سؤال حوله.تتفوق نموذجنا على العديد من خطوط الأساس كما يحكم عليها كل من المقاييس التلقائية والبشر.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

حققت أنظمة ربط الكيان (EL) نتائج مثيرة للإعجاب على المعايير القياسية بشكل أساسي بفضل التمثيلات السياقية المقدمة من نماذج اللغة المحددة مسبقا.ومع ذلك، لا تزال هذه الأنظمة تتطلب كميات ضخمة من البيانات - ملايين الأمثلة المسمى - في أفضل حالاتهم، مع أوقات تدريبية تتجاوز غالبا عدة أيام، خاصة عندما تتوفر موارد حسابية محدودة.في هذه الورقة، ننظر إلى كيفية استغلال التعرف على الكيان المسمى (ner) لتضييق الفجوة بين أنظمة EL المدربين على كميات عالية ومنخفضة من البيانات المسمى.وبشكل أكثر تحديدا، نوضح كيف وإلى أي مدى يمكن للنظام أن يستفيد نظام EL من NER لتعزيز تمثيلات كيانه، وتحسين اختيار المرشح، وحدد عينات سلبية أكثر فعالية وفرض قيود صلبة وناعمة على كيانات الإخراج.نطلق سراح البرامج ونقاط التفتيش النموذجية - في https://github.com/babelscape/ner4el.
يلخص الحوار يساعد القراء على التقاط المعلومات البارزة من محادثات طويلة في الاجتماعات والمقابلات والمسلسلات التلفزيونية. ومع ذلك، فإن حوالات العالم الحقيقي تشكل تحديا كبيرا لنماذج التلخيص الحالية، حيث يتجاوز طول الحوار عادة حدود المدخلات التي تفرضها ا لنماذج المدربة مسبقا القائمة على المحولات، والطبيعة التفاعلية للحوالات هي المعلومات ذات الصلة أكثر تعتمد على السياق وقدر موزعة من المقالات الإخبارية. في هذا العمل، نقوم بإجراء دراسة شاملة حول تلخيص الحوار الطويل من خلال التحقيق في ثلاث استراتيجيات للتعامل مع مشكلة الإدخال المطول وتحديد موقع المعلومات ذات الصلة: (1) نماذج المحولات الموسعة مثل Longformer، (2) استرداد نماذج خط أنابيب العديد من طرق استرجاع الحوار النطق، و (3) نماذج ترميز الحوار الهرمي مثل HMNet. نتائجنا التجريبية على ثلاث مجموعات بيانات حوار طويلة (QMSUM، MediaSum، Searscreen) تبين أن نماذج خط أنابيب الاسترداد - بعد ذلك، تسفر عن أفضل أداء. نوضح أيضا أنه يمكن تحسين جودة الملخص مع نموذج استرجاع أقوى وأحيث محاكاة بيانات الملخصات الخارجية المناسبة.
الهدف الشامل من معالجة اللغة الطبيعية هو تمكين الآلات من التواصل بسلاسة مع البشر.ومع ذلك، يمكن أن تكون اللغة الطبيعية غامضة أو غير واضحة.في حالات عدم اليقين، يشارك البشر في عملية تفاعلية تعرف باسم الإصلاح: طرح الأسئلة والسعي للحصول على توضيح حتى يتم حل حالة عدم اليقين.نقترح إطارا لبناء نموذج لسؤال أسئلة بصريا قادرة على إنتاج أسئلة توضيحات القطبية (نعم لا) لحل سوء الفهم في الحوار.يستخدم نموذجنا هدف معلومات متوقعة اكتبا لصالح أسئلة مفيدة من Captioner صورة خارج الرف دون الحاجة إلى أي بيانات للإجابة على الأسئلة الخاضعة للإشراف.نوضح قدرة النموذج لدينا على طرح الأسئلة التي تحسن النجاح التواصل في لعبة 20 أسئلة موجهة نحو الأهداف مع الإجابات الاصطناعية والإنسانية.
معظم أساليب الإجابة على الأسئلة القائمة على المعرفة الحالية (KBQA) تعلم أولا تعيين السؤال المحدد في رسم بياني للاستعلام، ثم قم بتحويل الرسم البياني إلى استعلام قابل للتنفيذ للعثور على الإجابة.عادة ما يتم توسيع الرسم البياني للاستعلام تدريجيا من كيان الموضوع بناء على نموذج تنبؤ التسلسل.في هذه الورقة، نقترح حل جديد للاستعلام عن جيل الرسم البياني الذي يعمل بالطريقة المعاكسة: نبدأ مع قاعدة المعرفة بأكملها وتقليصها تدريجيا إلى الرسم البياني للاستعلام المرغوب فيه.يعمل هذا النهج على تحسين كفاءة ودقة جيل الرسم البياني للاستعلام، خاصة بالنسبة لأسئلة قفز متعددة المعقدة.تظهر النتائج التجريبية أن طريقتنا تحقق أداء حديثة على مجموعة بيانات ComplexwebQuestion (CWQ).
تستخدم منصات الشبكة الاجتماعية عموما لمشاركة المحتوى الإيجابي والبناء والرائعة. ومع ذلك، في الآونة الأخيرة، غالبا ما يتعرض الناس على المحتوى المرفوض مثل التهديد وهجمات الهوية أو خطاب الكراهية أو الإهانات أو النصوص الفاحشة أو الملاحظات الهجومية أو الب لطجة. يركز العمل الحالي على كشف الكلام السام على التصنيف الثنائي أو على التمييز الخطاب السام بين مجموعة صغيرة من الفئات. تصف هذه الورقة النظام الذي اقترحه فريق Cisco for Semeval-2021 المهمة 5: الكشف عن الأمور السامة، أول مهمة مشتركة تركز على اكتشاف المواقف في النص الذي يعزى إلى سميته، باللغة الإنجليزية. نحن نقترب من هذه المشكلة في المقام الأول بطريقتين: نهج علامات التسلسل ونهج تحليل التبعية. في نهج علامات التسلسل لدينا، نعلم كل رمز رمزي في جملة تحت مخطط وضع علامات معينة. أثبتت بنية الأداء الخاصة بنا في هذا النهج أيضا أنها أفضل بنية أداء لدينا بشكل عام مع درجة F1 من 0.6922، وبالتالي وضع 7 لنا في مرحلة التقييم النهائية المتصدرين. نستكشف أيضا نهج تحليل التبعية حيث استخرفنا يمتد من عقوبة الإدخال تحت إشراف حدود المستهدفة المستهدفة وترتيب تمديدنا باستخدام نموذج بيافين. أخيرا، نقدم أيضا تحليلا مفصلا لنتائجنا وأداء النموذج في ورقنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا