ترغب بنشر مسار تعليمي؟ اضغط هنا

نقدم المهمة الجديدة لحل النزاعات اسم النطاق (DNDR)، والذي يتنبأ بنتيجة عملية لحل النزاعات حول استحقاق قانوني لاسم النطاق.يحدد TheICann UDRP عملية تحكيم إلزامية للنزاع بين مالك العلامة التجارية وسجل اسم النطاق المتعلق باسم مجال كبير المستوى (GTLD) (GT LD) (واحد ينتهي في .com، .org، .NET، إلخ).يؤدي طبيعة المشكلة إلى مجموعة بيانات متحفة للغاية، والتي تنبع من القدرة على تسجيل اسم مجال مع سهولة شديدة، ومصروفات قليلة للغاية، ولا حاجة لإثبات استحقاقها.في هذه الورقة، نحن تصف ثيتاسك ومجموعة البيانات المرتبطة بها.ونحن نقدم أيضا نتائج مرجعية بناء على مجموعة من MOD-ELS، والتي تظهر أن خطوط الأساس البسيطة بشكل عام صعبة التغلب عليها بسبب توزيع البيانات المنحرفة، ولكن في حالة المستفتى المحددة التي قدمت استجابة، برت ضبط صقليقدم النموذج تحسينات كبيرة على نموذج فئة الأغلبية
اجتذبت تحليل المعنويات الفئة في الآراء اهتمام الأبحاث المتزايد.تستخدم الأساليب المهيمنة نماذج لغة مدربة مسبقا عن طريق تعلم تمثيلات فعالة من الفئة من الفئة، وإضافة طبقات إخراج محددة إلى تمثيلها المدرب مسبقا.نحن نعتبر طريقة أكثر مباشرة لاستخدام نماذج ا للغة المدربة مسبقا، من خلال إلقاء مهام ACSA في مهام توليد اللغة الطبيعية، باستخدام جمل اللغة الطبيعية لتمثيل الإخراج.تتيح لطريقتنا استخدام المزيد من الاستخدام المباشر للمعرفة المدربة مسبقا في طرازات اللغة SEQ2SEQ من خلال إعداد المهام مباشرة أثناء التدريب المسبق.تشير التجارب في العديد من المعايير إلى أن طريقتنا تمنح أفضل النتائج المبلغ عنها، حيث توجد مزايا كبيرة في إعدادات قليلة وإعدادات طلقة صفرية.
اجتذبت حل مشكلة كلمة الرياضيات اهتماما كبيرا بحوثا كبيرا في السنوات الأخيرة. أظهرت الأعمال السابقة فعالية استخدام الشبكات العصبية الرسم البيانية لالتقاط العلاقات في المشكلة. ومع ذلك، فإن هذه الأعمال لم تأخذ بعناية معلومات تسمية الحافة وعلاقة الكلمة ا لطويلة المدى عبر الجمل في الاعتبار. بالإضافة إلى ذلك، أثناء التوليد، يركزون على أكثر المناطق ذات صلة بالكلمة التي تم إنشاؤها حاليا، مع إهمال بقية المشكلة. في هذه الورقة، نقترح نموذج رسم بياني هرمي ذو طراز ذو طراز هيروسي محسن على حافة على وجه التحديد، يتم استخدام تشفير الرسوم البيانية التسلسل الهرمية المحسنة على الحافة لدمج معلومات تسمية الحافة. يقوم هذا التشفير بتحديث عقود الرسم البياني هرمي خطوتين في خطوتين: تجميع مستوى الجملة ومجموعة على مستوى المشكلات. علاوة على ذلك، يتم تطبيق وحدة فك ترميز منظم من الأشجار مع آلية انحراف تقسيم لتوجيه النموذج للانتباه إلى أجزاء مختلفة من مشكلة الإدخال. أظهرت النتائج التجريبية على المؤشرات ومجموعات البيانات MAWPS و Math23K أن EEH-G2T يمكن أن تحسن بشكل فعال الأداء بشكل فعال مقارنة بالطرق الحديثة.
نحن نتطلع إلى تحدي التركيب المقدم من مؤشر المسح.باستخدام تكبير البيانات وتعديل هندسة SEQ2SEQ القياسية مع الاهتمام، نحقق نتائج SOTA على جميع المهام ذات الصلة من المعيار، وإظهار أن النماذج يمكن أن تعميم الكلمات المستخدمة في السياقات غير المرئية.نقترح ا متدادا للمعيار من خلال مهمة أصعب، والتي لا يمكن حلها بالطريقة المقترحة.
تعد دقة Coureference Event مشكلة بحثية مهمة في العديد من التطبيقات.على الرغم من النجاح الرائع الأخير للنماذج اللغوية المدربة مسبقا، فإننا نجادل بأنه لا يزال مفيدا للغاية لاستخدام الميزات الرمزية للمهمة.ومع ذلك، نظرا لأن المدخلات لتحليل Aquerence عادة ما تأتي من مكونات المنبع في خط أنابيب استخراج المعلومات، فإن الميزات الرمزية المستخرجة تلقائيا يمكن أن تكون صاخبة وأن تحتوي على أخطاء.أيضا، اعتمادا على السياق المحدد، يمكن أن تكون بعض الميزات أكثر إفادة من غيرها.بدافع من هذه الملاحظات، نقترح وحدة نمطية معتمدة على السياق على الرواية السيطرة على تدفق المعلومات من ميزات المدخلات الرمزية.جنبا إلى جنب مع طريقة تدريب صاخبة بسيطة، فإن أفضل طرازات لدينا تحقق نتائج أحدث من الفنون على مجموعة بيانات: ACE 2005 و KBP 2016.
شهدت مشكلة تصميم حلول NLP لمشاكل كلمة الرياضيات (MWP) نشاط بحثي مستمر ومكاسب ثابتة في دقة الاختبار. نظرا لأن الحلفل الموجودين يحققون أداء عاليا على مجموعات البيانات القياسية للمستوى الابتدائي الذي يحتوي على مشاكل في الكلمات الحسابية المجهولة الأولى، إلا أن هذه المشكلات غالبا ما يتم حلها في كثير من الأحيان "مع الجزء الأكبر من الاهتمام بالبحث إلى MWPS أكثر تعقيدا. في هذه الورقة، قصرنا انتباهنا إلى اللغة الإنجليزية MWPs تدرس في الصفوف الأربعة والأقل. نحن نقدم دليلا قويا على أن وحدات MWP الحالية تعتمد على الاستدلال الضحلة لتحقيق أداء عال في مجموعات البيانات القياسية. تحقيقا لهذه الغاية، نظهر أن حفلات MWP التي لا تملك الوصول إلى السؤال المطلوب في MWP، لا يزال بإمكانك حل جزء كبير من MWPS. وبالمثل، فإن النماذج التي تعالج mwps كحقيبة من الكلمات يمكن أن تحقق أيضا دقة عالية بشكل مدهش. علاوة على ذلك، نقدم مجموعة بيانات تحدي، Svamp، تم إنشاؤها من خلال تطبيق الاختلافات المختارة بعناية على الأمثلة التي تم أخذ عينات منها من مجموعات البيانات الحالية. إن أفضل الدقة التي تحققت بها النماذج الحديثة أقل بكثير على Svamp، وبالتالي إظهار الكثير لا يزال يتعين القيام به حتى لأبسط MWPS.
تم تجاهل المعلومات النحوية والدلية الخارجية إلى حد كبير من قبل نماذج حل النواة العصبية الحالية.في هذه الورقة، نقدم نموذجا مقرا له من الرسوم البيانية غير متجانسة لإدماج الهياكل النحوية والدلالية للجمل.يحتوي الرسم البياني المقترح على رسم بياني فرعي سنو ي حيث يتم توصيل الرموز الرائعة بناء على شجرة التبعية، ورسم إلكتروني فرعي دلالي يحتوي على حجج ويستند كمستلزمات دورا دالايا كحواف.من خلال تطبيق شبكة انتباه الرسوم البيانية، يمكننا الحصول على تمثيل كلمة معدنية من الناحية النحوية وغير المعزز، والتي يمكن دمجها باستخدام طبقة تكامل اليقظة وآلية Gating.تجارب في OnTonotes 5.0 معيار المعيار إظهار فعالية نموذجنا المقترح.
تهدف التعرف على علاقة الخطاب الضمني (IDRR) إلى تحديد العلاقات المنطقية بين جملتين مجاورة في الخطاب.تفشل النماذج الحالية في الاستفادة الكاملة من المعلومات السياقية التي تلعب دورا مهما في تفسير كل جملة محلية.في هذه الورقة، فإننا نقترحنا بالتالي شبكة تت بع السياق في الرسم البياني القائمة على الرسم البياني (شبكة CT) لنموذج سياق الخطاب ل IDRR.تقوم CT-Net أولا بتحويل الخطاب في الرسم البياني لرابطة الفقرة (PAG)، حيث تتبع كل جملة سياقها المرتبطة ارتباطا وثيقا من الخطاب المعقد من خلال أنواع مختلفة من الحواف.بعد ذلك، استخراج CT-NET تمثيل سياقي من PAG من خلال آلية تحديث تم تصميمه خصيصا، مما يمكن أن يدمج بفعالية من كل من دلالات السياق على مستوى الجملة ومستوى الرمز المميز.تشير التجارب على PDTB 2.0 إلى أن شبكة CT-NET أكبر أداء أفضل من النماذج التي نموذجها تقريبا السياق.
يعمل العمل الحديث على قرار كائن كائن (CR) على اتجاه الاتجاهات الحالية في التعلم العميق المطبق على المدينات والميزات ذات الصلة بسيطة نسبيا.لا تستخدم نماذج Sota تمثيلات هرمية بنية الخطاب.في هذا العمل، نستفيد تلقائيا التي تم بناؤها تلقائيا تحليل الأشجار في نهج عصبي وإظهار تحسن كبير في مجموعات عمليتين من كائن كوريا القياسي.نستكشف كيف يختلف التأثير اعتمادا على نوع الإشارة.
تدرس هذه الورقة مشكلة دقة Aquerence Aquerence Coursence (CDE) التي تسعى إلى تحديد ما إذا كان يذكر الحدث عبر مستندات متعددة تشير إلى نفس الأحداث في العالم الحقيقي.أظهر العمل المسبق فوائد معلومات الوسائد وسياق الوثيقة لحل فور معلومات الحدث.ومع ذلك، لم يتم التقاط هذه المعلومات بفعالية في العمل السابق ل CDECR.لمعالجة هذه القيود، نقترح نموذجا تعليميا عميقا جديدا ل CDEG الذي يقدم الرصاص الهرمي للشبكات العصبية التنافعية (GCN) إلى إشراف الكيان والحكام المشترك.على هذا النحو، تمكن GCNs مستوى الجملة من ترميز كلمات السياق المهمة لذكر الحدث وحججها بينما يهدف GCN على مستوى المستند إلى تذكر هياكل التفاعل الحدث والحجج لحساب تمثيلات الوثيقة لأداء CDU.يتم إجراء تجارب واسعة لإظهار فعالية النموذج المقترح.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا