ترغب بنشر مسار تعليمي؟ اضغط هنا

العمل الحالي على طاولات نماذج التعلم المشتركة في التمثيل الجداول والنص المرتبط باستخدام الوظائف الموضوعية الخاضعة للإشراف ذاتي المستمدة من نماذج اللغة المحددة مسبقا مثل Bert.في حين أن هذا المحاط بالمفصل يحسن المهام التي تنطوي على الجداول والنص المقتر ن (على سبيل المثال، الرد على أسئلة حول الجداول)، نوضح أنه لا يقلل من المهام التي تعمل على الجداول دون أي نص مرتبط (E.G.، ملء الخلايا المفقودة).نحن نركض موضوعا بسيطا محددا (اكتشاف الخلايا الفاسدة) التي تتعلم حصريا من البيانات الجدولة وتصل إلى أحدث من بين الفن على مجموعة من مهام التنبؤ القائمة على الطاولة.على عكس النهج المتنافسة، يوفر النموذج الخاص بنا (TABBIE) Asspeddings من جميع درجات الباطن الأساسي (الخلايا والصفوف والأعمدة)، كما أنها تتطلب أيضا حساب أقل بكثير للتدريب.يوضح تحليل نوعي للخلية المستفادة في النموذج، العمود، وتمثيلات الصف أنه يفهم دلالات الجدول المعقدة والاتجاهات العددية.
وقد ثبت أن التعرف على الكيان المسمى (NER) قد يستفيد من دمج المعلومات المهيكلة لمسافات طويلة التي تم التقاطها بواسطة أشجار التبعية. نعتقد أن هذا هو أن كلا النوعين من الميزات - المعلومات السياقية التي تم التقاطها من خلال التسلسلات الخطية والمعلومات الم هيكلة التي تم الاستيلاء عليها أشجار التبعية قد تكمل بعضها البعض. ومع ذلك، تركز النهج الحالية إلى حد كبير على تكديس الشبكات العصبية LSTM والرسم البيانية مثل الشبكات التنافسية الرسم البيانية (GCNS) لبناء نماذج NER محسنة، حيث لا تكون آلية التفاعل الدقيقة بين النوعين من الميزات واضحة للغاية، وتكسب الأداء يبدو أن تكون كبيرة. في هذا العمل، نقترح حلا بسيطا وقويا لدمج كلا النوعين من الميزات مع تآزرنا - LSTM (SYN-LSTM)، والذي يلتقط بوضوح كيف يتفاعل نوعان الميزات. نقوم بإجراء تجارب مكثفة على العديد من البيانات القياسية عبر أربع لغات. تظهر النتائج أن النموذج المقترح يحقق أداء أفضل من الأساليب السابقة مع مطالبة معلمات أقل. يوضح تحليلنا الإضافي أن نموذجنا يمكنه التقاط تبعيات أطول مقارنة مع خطوط الأساس القوية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا