يهدف السبب السببي إلى التنبؤ بالسيناريوهات المستقبلية التي قد يكون سببها الإجراءات الملحوظة.ومع ذلك، فإن أساليب المنطق السببية الموجودة تتعامل مع الضغط على مستوى الكلمة.في هذه الورقة، نقترح طريقة التفكير السببية السببية على مستوى الحدث وإظهار استخدام
ها في مهمة توليد التأثير.على وجه الخصوص، نقوم بتكييف أزواج الأحداث التي تمت ملاحظتها في السبب في شبكة سببية حدث، والتي تصف التبعيات السببية.بالنظر إلى جملة مدخلات، يتم استرداد مجموعة فرعية سببية من شبكة السببية الحدث ويتم ترميزها مع آلية اهتمامات الرسم البياني، من أجل دعم التفكير الأفضل للآثار المحتملة.ثم يتم تحديد حدث التأثير الأكثر احتمالا من الفحص الفرعي السببي ويستخدم كإرشادات لتوليد جملة تأثير.تظهر التجارب أن طريقتنا تولد جمل أكثر معقولة من مختلف المنافسين المصممين بشكل جيد.
التفكير الشديد هو وضع المنطق حيث يمكن إقليم الاستنتاجات من خلال مراعاة الأدلة الجديدة.أدب الأدب العلوم المعرفي الموجود بشأن التفكير الشديد يشير إلى أن الشخص يشكل نموذجا عقليا "سيناريو المشكلة قبل الإجابة على الأسئلة.يسأل هدفنا البحثي عما إذا كانت الن
ماذج العصبية يمكن أن تستفيد بالمثل من تصور سيناريو الأسئلة قبل الإجابة على استعلام دافئ.نهجنا هو، بالنظر إلى سؤال، أن يكون لديك نموذج أولا إنشاء رسم بياني للتأثيرات ذات الصلة، ثم الاستفادة من ذلك الرسم البياني كمدخل إضافي عند الإجابة على السؤال.نظامنا، فضولي، يحقق حالة جديدة من بين الفنين في ثلاث مجموعات من أدوات التفكير المختلفة.هذه النتيجة مهمة حيث توضح أنه يمكن تحسين الأداء من خلال توجيه نظام للتفكير في "السؤال والنموذج الصريح السيناريو، بدلا من الإجابة عن الانعكاس.
الرسوم البيانية المعرفة ضرورية للعديد من تطبيقات معالجة اللغة الطبيعية المصب، ولكنها غير مكتملة عادة مع العديد من الحقائق المفقودة. ينتج عن هذا الجهود البحثية في مهمة التفكير المتعدد القفزات، والتي يمكن صياغة كعملية بحث ونماذج حالية تؤدي عادة منطق بع
يد المنال. ومع ذلك، فإن السبب البعيد الطويل أمر حيوي أيضا بالقدرة على توصيل الكيانات غير المرتبطة بسطحية. بأفضل من علمنا، يفتقر إلى وجود إطار عام يقترب من التفكير المتعدد القفز في سيناريوهات التفكير المسؤولة لفترة طويلة مختلطة. نقول أن هناك مشكلتان رئيسيتان لنموذج التفكير المتعدد القفز العام: ط) أين تذهب، والثاني) عند التوقف. لذلك، نقترح نموذج عام يحدد المشكلات ذات ثلاث وحدات: 1) وحدة المعرفة المحلية المحلية لتقدير المسارات المحتملة، 2) وحدة التسرب الإجراءات المختلفة لاستكشاف مجموعة متنوعة من المسارات، و 3) التوقف التكيفي وحدة البحث لتجنب البحث عنها. توضح النتائج الشاملة على ثلاث مجموعات بيانات تفوق نموذجنا مع تحسينات كبيرة ضد خطوط الأساس في سيناريوهات التفكير المسافة القصيرة والطويلة.
تهدف المنطق الرياضي إلى استنتاج الحلول الراضية بناء على أسئلة الرياضيات المعينة. أثبتت أبحاث معالجة اللغة الطبيعية السابقة فعالية التسلسل إلى التسلسل (SEQ2SEQ) أو المتغيرات ذات الصلة على حل الرياضيات. ومع ذلك، تمكن عدد قليل من الأعمال من استكشاف المع
لومات الهيكلية أو النحوية المخفية في التعبيرات (على سبيل المثال، الأسبقية والزملاء). وضعت هذه الرسالة للتحقيق في فائدة مثل هذه المعلومات غير المستغلة للهندسة العصبية. أولا، يتم تمثيل الأسئلة الرياضية بتنسيق الرسوم البيانية داخل تحليل بناء الجملة. تتيح لهم الطبيعة المنظمة للرسوم البيانية أن تمثل علاقات المتغيرات أو المشغلين مع الحفاظ على دلالات التعبيرات. بعد أن تحولت إلى التمثيلات الجديدة، اقترحنا Graphmr الشبكة العصبية الرسمية الرسمية، والتي يمكن أن تتعلم بفعالية المعلومات الهرمية من مدخلات الرسوم البيانية لحل الرياضيات وتوقع الإجابات. يتم بناء سيناريو تجريبي كامل مع أربع فئات من المهام الرياضية وثلاثة خطوط خطوط خطوط خطوط SEQ2SEQ لإجراء تحليل شامل، وتظهر النتائج أن Graphmr تفوقت على الآخرين في التعلم والمعلومات المخفية والحل الرياضيات.
نقوم بتطوير نظام موحد للإجابة مباشرة من أسئلة النص المفتوح النص قد تتطلب عددا مختلفا من خطوات الاسترجاع. نحن نوظف نموذجا واحدا للمحولات متعددة المهام لأداء جميع الملاحات الفرعية اللازمة - - استرجاع الحقائق الداعمة، وإعادة تشغيلها، والتنبؤ بإجابة جميع
المستندات المستردة --- بطريقة تكرارية. نتجنب الافتراضات الحاسمة للعمل السابق لا ينقل جيدا إلى إعدادات العالم الحقيقي، بما في ذلك استغلال المعرفة بالعدد الثابت من خطوات الاسترجاع المطلوبة للإجابة على كل سؤال أو استخدام البيانات الوصفية الهيكلية مثل قواعد المعرفة أو روابط الويب التي لها توافر محدود. بدلا من ذلك، نقوم بتصميم نظام يمكنه الرد على أسئلة مفتوحة على أي مجموعة نصية دون معرفة مسبقة بتعقيد المعنى. لمحاكاة هذا الإعداد، نبني معيارا جديدا، يسمى BEERSQA، من خلال الجمع بين مجموعات البيانات الموجودة ذات الخطوة الحالية مع مجموعة جديدة من 530 سؤالا تتطلب ثلاث صفحات ويكيبيديا للرد عليها، توحيد إصدارات ويكيبيديا كوربور في العملية. نظهر أن نموذجنا يوضح أداء تنافسي على كل من المعايير الحالية وهذا المعيار الجديد. نجعل المعيار الجديد متاحا في https://beerqa.github.io/.
على الرغم من نجاح أنظمة الحوار العصبي في تحقيق أداء عال في مجلس الإدارة، لا يمكنهم تلبية متطلبات المستخدمين في الممارسة العملية، بسبب ضعف مهارات المنطق. السبب الأساسي هو أن معظم نماذج الحوار العصبي تلتقط فقط المعلومات النحوية والدلية، ولكنها تفشل في
نموذج الاتساق المنطقي بين محفوظات الحوار والاستجابة الناتجة. في الآونة الأخيرة، تم اقتراح مهمة حوار جديدة متعددة الدوران، لتسهيل أبحاث التفكير الحوار. ومع ذلك، هذه المهمة صعبة، لأن هناك اختلافات طفيفة فقط بين الاستجابة غير المنطقية وتاريخ الحوار. كيفية حل هذا التحدي فعال لا يزال يستحق الاستكشاف. تقترح هذه الورقة نموذج مقارنة غرامة (FCM) لمعالجة هذه المشكلة. مستوحاة من سلوك الإنسان في فهم القراءة، يقترح تركيز آلية المقارنة على الاختلافات الجميلة في تمثيل كل مرشح استجابة. على وجه التحديد، يتم مقارنة كل تمثيل مرشح بالسجل بأكمله للحصول على تمثيل تناسق التاريخ. علاوة على ذلك، تعتبر إشارات الاتساق بين كل مرشح وتاريخ مكبر الصوت في قيادة نموذج يفضل مرشحا متسقا منطقيا مع منطق تاريخ المتكلم. أخيرا، يتم توظيف تمثيلات الاتساق أعلاه لإخراج قائمة التصنيفات من ردود المرشحين لتفويض الحوار متعدد الدوران. النتائج التجريبية على مجموعة بيانات الحوار العامة تظهر أن طريقتنا تحصل على درجات أعلى تصنيف من النماذج الأساسية.
في الإعدادات الاجتماعية، يخضع الكثير من السلوك البشري قواعد سلوك غير معلن في المعايير المجتمعية. بالنسبة للأنظمة الاصطناعية التي سيتم دمجها بالكامل في البيئات الاجتماعية، فإن الالتزام بهذه القواعد هو شرط أساسي. للتحقيق في ما إذا كانت نماذج توليد اللغ
ة يمكن أن تكون بمثابة مشاكل سلوكية للأنظمة المنتشرة في الإعدادات الاجتماعية، فإننا نقيم قدرتها على توليد أوصاف عمل تحقق أهدافا محددة مسبقا في القيود المعيارية. علاوة على ذلك، نحن ندرس إذا كانت النماذج يمكن أن تتوقع عواقب من المحتمل إجراءات إما مراقبة أو تنتهك المعايير المعروفة، أو شرح سبب تفضيل بعض الإجراءات من خلال توليد فرضيات المعايير ذات الصلة. لهذا الغرض، نقدم قصصا أخلاقية، ومجموعة بيانات من جمهور الحشد من الروايات المنظمة، المتفرعة لدراسة المنطق الاجتماعي المحدد، الموجه نحو الأهداف. أخيرا، نقترح استراتيجيات فك التشفير التي تجمع بين نماذج خبراء متعددة لتحسين جودة الإجراءات الناتجة والآثار والمؤسسات القوية بشكل كبير.
يتم تعريف المنزول على أنه المعرفة التي يوافق عليها الجميع. ومع ذلك، فإن أنواع معينة من المعرفة المنطقية مرتبطة بالثقافة والمواقع الجغرافية ويتم تقاسمها فقط محليا. على سبيل المثال، تختلف مشاهد مراسم الزفاف عبر المناطق الناجمة عن الجمارك المختلفة التي
تتأثر بالعوامل التاريخية والدينية. ومع ذلك، حذفت هذه الخصائص الإقليمية عموما في العمل السابق. في هذه الورقة، نقوم بإنشاء مجموعة بيانات منطق مرئية للبصرية (GD-VCR) لاختبار قدرة النماذج في الرؤية واللغة على فهم المنطقية الثقافية والرائعة. على وجه الخصوص، نقوم بدراسة نماذج للرؤية واللغدية التي من بين الفنون، و Visualbert و Vilbert تدربت على VCR، وهو معيار قياسي مع الصور في المقام الأول من المناطق الغربية. بعد ذلك تقييم مدى جودة أن تعميم النماذج المدربة للإجابة على الأسئلة في GD-VCR. نجد أن أداء كلا النماذج للمناطق غير الغربية بما في ذلك شرق آسيا وجنوب آسيا وأفريقيا أقل بكثير من تلك الخاصة بالمنطقة الغربية. نقوم بتحليل الأسباب الكامنة وراء تباين الأداء وتجد أن فجوة الأداء أكبر على أزواج ضمنيا: 1) تشعر بالقلق من السيناريوهات المتعلقة بالثقافة، على سبيل المثال، حفلات الزفاف، الأنشطة الدينية، والمهرجانات؛ 2) تتطلب منطق المنطقي الجغرافي الرفيع المستوى بدلا من التصور والاعتراف بالترتيب المنخفض. يتم إصدار DataSet و Code في https://github.com/wadeyin9712/gd-vcr.
إن حجم البيانات المالية الهائلة يجعل من الصعب الوصول إلى البشر ويحللون قطاع الأعمال. تواجه المنطق العددي القوي بالمثل تحديات فريدة من نوعها في هذا المجال. في هذا العمل، نركز على الإجابة على الأسئلة العميقة على البيانات المالية، تهدف إلى أتمتة تحليل ل
جنة كبيرة من الوثائق المالية. على عكس المهام الحالية على المجال العام، يتضمن مجال التمويل التفكير العددي المعقد وفهم تمثيلات غير متجانسة. لتسهيل التقدم التحليلي، نقترح مجموعة بيانات جديدة واسعة النطاق، فنقة، مع أزواج الإجابة على السؤال حول التقارير المالية، التي كتبها خبراء ماليون. كما نبحث أيضا عن برامج المنطق الذهبي لضمان التوضيح الكامل. ونحن نقدم أيضا خطوط الأساس وإجراء تجارب شاملة في مجموعة البيانات الخاصة بنا. توضح النتائج أن النماذج الشعبية الكبيرة والمدربة مسبقا تنخفض بعيدا عن البشر الخبراء في الحصول على المعرفة المالية وفي التفكير العددي متعدد الخطوات المعقدة في هذه المعرفة. لدينا DataSet - أول نوع - يجب أن تتيح بحث مجتمعي كبير جديد في مجالات التطبيق المعقدة. تتوفر DataSet and Code علنا في HTTPS://github.com/czyssrs/finqa.
شهدت السنوات الأخيرة نجاحا رائعا في نظام الحوار الموجه نحو المهام في نهاية إلى نهج، خاصة عند دمج معلومات المعرفة الخارجية. ومع ذلك، لا تزال جودة الاستجابة المتولدة في معظم النماذج القائمة محدودة، ويرجع ذلك أساسا إلى عدم وجود التفكير الدقيق في المعرفة
الحتمية (WRT الرموز المفاهيمية)، مما يجعل من الصعب التقاط التحولات المفهوم وتحديد نية المستخدم الحقيقية في الصليب -task سيناريوهات. لمعالجة هذه المشكلات، نقترح آلية نية جديدة لتحسين معرفة الكيان الحتمي بشكل أفضل. استنادا إلى مثل هذه الآلية، فإننا نقترح أيضا شبكة منطق النية (IR-NET)، والتي تتألف من التفكير المشترك والمتعدد، للحصول على تمثيلات نية من الرموز المفاهيمية التي يمكن استخدامها لالتقاط التحولات المفهوم المتضمنة في المهمة المحادثات المتداولة، بحيث لتحديد نية المستخدم بفعالية وتوليد ردود أكثر دقة. تحقق النتائج التجريبية من فعالية IR-NET، والتي توضح أنها تحقق الأداء الحديثة في مجموعات حوار ملثى متعدد المجالات.