ترغب بنشر مسار تعليمي؟ اضغط هنا

في الإعدادات الاجتماعية، يخضع الكثير من السلوك البشري قواعد سلوك غير معلن في المعايير المجتمعية. بالنسبة للأنظمة الاصطناعية التي سيتم دمجها بالكامل في البيئات الاجتماعية، فإن الالتزام بهذه القواعد هو شرط أساسي. للتحقيق في ما إذا كانت نماذج توليد اللغ ة يمكن أن تكون بمثابة مشاكل سلوكية للأنظمة المنتشرة في الإعدادات الاجتماعية، فإننا نقيم قدرتها على توليد أوصاف عمل تحقق أهدافا محددة مسبقا في القيود المعيارية. علاوة على ذلك، نحن ندرس إذا كانت النماذج يمكن أن تتوقع عواقب من المحتمل إجراءات إما مراقبة أو تنتهك المعايير المعروفة، أو شرح سبب تفضيل بعض الإجراءات من خلال توليد فرضيات المعايير ذات الصلة. لهذا الغرض، نقدم قصصا أخلاقية، ومجموعة بيانات من جمهور الحشد من الروايات المنظمة، المتفرعة لدراسة المنطق الاجتماعي المحدد، الموجه نحو الأهداف. أخيرا، نقترح استراتيجيات فك التشفير التي تجمع بين نماذج خبراء متعددة لتحسين جودة الإجراءات الناتجة والآثار والمؤسسات القوية بشكل كبير.
التفكير الشديد هو وضع المنطق حيث يمكن إقليم الاستنتاجات من خلال مراعاة الأدلة الجديدة.أدب الأدب العلوم المعرفي الموجود بشأن التفكير الشديد يشير إلى أن الشخص يشكل نموذجا عقليا "سيناريو المشكلة قبل الإجابة على الأسئلة.يسأل هدفنا البحثي عما إذا كانت الن ماذج العصبية يمكن أن تستفيد بالمثل من تصور سيناريو الأسئلة قبل الإجابة على استعلام دافئ.نهجنا هو، بالنظر إلى سؤال، أن يكون لديك نموذج أولا إنشاء رسم بياني للتأثيرات ذات الصلة، ثم الاستفادة من ذلك الرسم البياني كمدخل إضافي عند الإجابة على السؤال.نظامنا، فضولي، يحقق حالة جديدة من بين الفنين في ثلاث مجموعات من أدوات التفكير المختلفة.هذه النتيجة مهمة حيث توضح أنه يمكن تحسين الأداء من خلال توجيه نظام للتفكير في "السؤال والنموذج الصريح السيناريو، بدلا من الإجابة عن الانعكاس.
في الآونة الأخيرة، حققت نماذج اللغة (LMS) أداء كبيرا في العديد من مهام NLU، التي حفزت اهتماما واسع النطاق للتطبيقات المحتملة في المجال العلمي والاجتماعي.ومع ذلك، واجهت LMS الكثير من الانتقاد لما إذا كانت قادرة حقا على التفكير في NLU.في هذا العمل، نقت رح طريقة تشخيصية للمنطق المنطقي من الدرجة الأولى (FOL) مع معيار جديد مقترح، Logicnli.Logicnli عبارة عن مجموعة بيانات ذات طراز NLI الذي تم تنشيطه بشكل فعال من مستهدف فولت المستهدف من استنتاج المنطقي ويمكن استخدامه لتشخيص LMS من أربعة وجهات نظر: الدقة والمتانة والتعميم والتفسيرية.كشفت تجارب على بيرت وروبرتا و XLNET، عن نقاط الضعف في هؤلاء LMS بشأن التفكير فول، مما يحفز الاستكشاف المستقبلي لتعزيز قدرة المنطق.
نقوم بتطوير نظام موحد للإجابة مباشرة من أسئلة النص المفتوح النص قد تتطلب عددا مختلفا من خطوات الاسترجاع. نحن نوظف نموذجا واحدا للمحولات متعددة المهام لأداء جميع الملاحات الفرعية اللازمة - - استرجاع الحقائق الداعمة، وإعادة تشغيلها، والتنبؤ بإجابة جميع المستندات المستردة --- بطريقة تكرارية. نتجنب الافتراضات الحاسمة للعمل السابق لا ينقل جيدا إلى إعدادات العالم الحقيقي، بما في ذلك استغلال المعرفة بالعدد الثابت من خطوات الاسترجاع المطلوبة للإجابة على كل سؤال أو استخدام البيانات الوصفية الهيكلية مثل قواعد المعرفة أو روابط الويب التي لها توافر محدود. بدلا من ذلك، نقوم بتصميم نظام يمكنه الرد على أسئلة مفتوحة على أي مجموعة نصية دون معرفة مسبقة بتعقيد المعنى. لمحاكاة هذا الإعداد، نبني معيارا جديدا، يسمى BEERSQA، من خلال الجمع بين مجموعات البيانات الموجودة ذات الخطوة الحالية مع مجموعة جديدة من 530 سؤالا تتطلب ثلاث صفحات ويكيبيديا للرد عليها، توحيد إصدارات ويكيبيديا كوربور في العملية. نظهر أن نموذجنا يوضح أداء تنافسي على كل من المعايير الحالية وهذا المعيار الجديد. نجعل المعيار الجديد متاحا في https://beerqa.github.io/.
على الرغم من نجاح أنظمة الحوار العصبي في تحقيق أداء عال في مجلس الإدارة، لا يمكنهم تلبية متطلبات المستخدمين في الممارسة العملية، بسبب ضعف مهارات المنطق. السبب الأساسي هو أن معظم نماذج الحوار العصبي تلتقط فقط المعلومات النحوية والدلية، ولكنها تفشل في نموذج الاتساق المنطقي بين محفوظات الحوار والاستجابة الناتجة. في الآونة الأخيرة، تم اقتراح مهمة حوار جديدة متعددة الدوران، لتسهيل أبحاث التفكير الحوار. ومع ذلك، هذه المهمة صعبة، لأن هناك اختلافات طفيفة فقط بين الاستجابة غير المنطقية وتاريخ الحوار. كيفية حل هذا التحدي فعال لا يزال يستحق الاستكشاف. تقترح هذه الورقة نموذج مقارنة غرامة (FCM) لمعالجة هذه المشكلة. مستوحاة من سلوك الإنسان في فهم القراءة، يقترح تركيز آلية المقارنة على الاختلافات الجميلة في تمثيل كل مرشح استجابة. على وجه التحديد، يتم مقارنة كل تمثيل مرشح بالسجل بأكمله للحصول على تمثيل تناسق التاريخ. علاوة على ذلك، تعتبر إشارات الاتساق بين كل مرشح وتاريخ مكبر الصوت في قيادة نموذج يفضل مرشحا متسقا منطقيا مع منطق تاريخ المتكلم. أخيرا، يتم توظيف تمثيلات الاتساق أعلاه لإخراج قائمة التصنيفات من ردود المرشحين لتفويض الحوار متعدد الدوران. النتائج التجريبية على مجموعة بيانات الحوار العامة تظهر أن طريقتنا تحصل على درجات أعلى تصنيف من النماذج الأساسية.
تهدف المنطق الرياضي إلى استنتاج الحلول الراضية بناء على أسئلة الرياضيات المعينة. أثبتت أبحاث معالجة اللغة الطبيعية السابقة فعالية التسلسل إلى التسلسل (SEQ2SEQ) أو المتغيرات ذات الصلة على حل الرياضيات. ومع ذلك، تمكن عدد قليل من الأعمال من استكشاف المع لومات الهيكلية أو النحوية المخفية في التعبيرات (على سبيل المثال، الأسبقية والزملاء). وضعت هذه الرسالة للتحقيق في فائدة مثل هذه المعلومات غير المستغلة للهندسة العصبية. أولا، يتم تمثيل الأسئلة الرياضية بتنسيق الرسوم البيانية داخل تحليل بناء الجملة. تتيح لهم الطبيعة المنظمة للرسوم البيانية أن تمثل علاقات المتغيرات أو المشغلين مع الحفاظ على دلالات التعبيرات. بعد أن تحولت إلى التمثيلات الجديدة، اقترحنا Graphmr الشبكة العصبية الرسمية الرسمية، والتي يمكن أن تتعلم بفعالية المعلومات الهرمية من مدخلات الرسوم البيانية لحل الرياضيات وتوقع الإجابات. يتم بناء سيناريو تجريبي كامل مع أربع فئات من المهام الرياضية وثلاثة خطوط خطوط خطوط خطوط SEQ2SEQ لإجراء تحليل شامل، وتظهر النتائج أن Graphmr تفوقت على الآخرين في التعلم والمعلومات المخفية والحل الرياضيات.
شهدت السنوات الأخيرة نجاحا رائعا في نظام الحوار الموجه نحو المهام في نهاية إلى نهج، خاصة عند دمج معلومات المعرفة الخارجية. ومع ذلك، لا تزال جودة الاستجابة المتولدة في معظم النماذج القائمة محدودة، ويرجع ذلك أساسا إلى عدم وجود التفكير الدقيق في المعرفة الحتمية (WRT الرموز المفاهيمية)، مما يجعل من الصعب التقاط التحولات المفهوم وتحديد نية المستخدم الحقيقية في الصليب -task سيناريوهات. لمعالجة هذه المشكلات، نقترح آلية نية جديدة لتحسين معرفة الكيان الحتمي بشكل أفضل. استنادا إلى مثل هذه الآلية، فإننا نقترح أيضا شبكة منطق النية (IR-NET)، والتي تتألف من التفكير المشترك والمتعدد، للحصول على تمثيلات نية من الرموز المفاهيمية التي يمكن استخدامها لالتقاط التحولات المفهوم المتضمنة في المهمة المحادثات المتداولة، بحيث لتحديد نية المستخدم بفعالية وتوليد ردود أكثر دقة. تحقق النتائج التجريبية من فعالية IR-NET، والتي توضح أنها تحقق الأداء الحديثة في مجموعات حوار ملثى متعدد المجالات.
في حين أن طرازات اللغة المدربة مسبقا (PTLMS) حققت نجاحا ملحوظا في العديد من مهام NLP، إلا أنها ما زالوا يكافحون من أجل المهام التي تتطلب منطق الحدث الزمني، وهو أمر ضروري للتطبيقات المرن في الحدث. نقدم نهجا مستمرا مسبقا يزود PTLMS مع المعرفة المستهدفة حول العلاقات الزمنية للحدث. نقوم بتصميم أهداف التعلم ذات الإشراف الذاتي لاستعادة الحدث الملثمان والمؤشرات الزمنية وتمييز الأحكام من نظرائهم الفاسد (حيث تم استبدال الحدث أو المؤشرات الزمنية). بمزيد من التدريب مسبقا PTLM مع هذه الأهداف بشكل مشترك، نعزز انتباهها إلى الحدث والمعلومات الزمنية، مما أدى إلى تعزيز القدرة المعززة على المنطق الزمني للحدث. هذا ** e ** ffective ** con ** إطار ما قبل التدريب المعدني ** ه ** تنفيس ** T ** منطق Emporal (Econet) يحسن عروض الضبط الدقيقة PTLMS عبر خمسة استخراج العلاقات والسؤال وتحقق عروضا جديدة أو على قدم المساواة في معظم مهامنا المصب لدينا.
يتم تعريف المنزول على أنه المعرفة التي يوافق عليها الجميع. ومع ذلك، فإن أنواع معينة من المعرفة المنطقية مرتبطة بالثقافة والمواقع الجغرافية ويتم تقاسمها فقط محليا. على سبيل المثال، تختلف مشاهد مراسم الزفاف عبر المناطق الناجمة عن الجمارك المختلفة التي تتأثر بالعوامل التاريخية والدينية. ومع ذلك، حذفت هذه الخصائص الإقليمية عموما في العمل السابق. في هذه الورقة، نقوم بإنشاء مجموعة بيانات منطق مرئية للبصرية (GD-VCR) لاختبار قدرة النماذج في الرؤية واللغة على فهم المنطقية الثقافية والرائعة. على وجه الخصوص، نقوم بدراسة نماذج للرؤية واللغدية التي من بين الفنون، و Visualbert و Vilbert تدربت على VCR، وهو معيار قياسي مع الصور في المقام الأول من المناطق الغربية. بعد ذلك تقييم مدى جودة أن تعميم النماذج المدربة للإجابة على الأسئلة في GD-VCR. نجد أن أداء كلا النماذج للمناطق غير الغربية بما في ذلك شرق آسيا وجنوب آسيا وأفريقيا أقل بكثير من تلك الخاصة بالمنطقة الغربية. نقوم بتحليل الأسباب الكامنة وراء تباين الأداء وتجد أن فجوة الأداء أكبر على أزواج ضمنيا: 1) تشعر بالقلق من السيناريوهات المتعلقة بالثقافة، على سبيل المثال، حفلات الزفاف، الأنشطة الدينية، والمهرجانات؛ 2) تتطلب منطق المنطقي الجغرافي الرفيع المستوى بدلا من التصور والاعتراف بالترتيب المنخفض. يتم إصدار DataSet و Code في https://github.com/wadeyin9712/gd-vcr.
مهارات التفكير العددي ضرورية للإجابة على الأسئلة المعقدة (CQA) على النص.يتطلب opertaions بما في ذلك العد والمقارنة والإضافة والطرح.يتبع نهج ناجح في CQA على النص، وشبكات الوحدات النمطية العصبية (NMNS)، تتبع نموذج المبرمج ومترجم البرامج النمطية النمطية المتخصصة لأداء التفكير التركيبي.ومع ذلك، فإن إطار NMNS لا ينظر في العلاقة بين الأرقام والكيانات في كل من الأسئلة والفقرات.نقترح تقنيات فعالة لتحسين قدرات التفكير العددي NMNS من خلال إدراك السؤال المترجم والتقاط العلاقة بين الكيانات والأرقام.على نفس المجموعة الفرعية من DataSet Drop for CQA على النص، تظهر النتائج التجريبية أن إضافاتنا تتفوق على NMNS الأصلي بنسبة 3.0 نقاط للحصول على درجة F1 الإجمالية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا