ترغب بنشر مسار تعليمي؟ اضغط هنا

التعليق الشرطي للحقيقة لبيانات سلسلة الوقت

Truth-Conditional Captions for Time Series Data

110   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نستكشف مهمة توليد أوصاف اللغة الطبيعية تلقائيا لأنماط بارزة في سلسلة زمنية، مثل أسعار الأسهم لشركة أكثر من أسبوع. يجب أن يكون نموذج لهذه المهمة قادرا على استخراج أنماط رفيعة المستوى مثل وجود ذروة أو تراجع. في حين أن النماذج العصبية المعاصرة النموذجية مع آليات الاهتمام يمكن أن تولد أوصاف إخراج بطلاقة لهذه المهمة، فإنها غالبا ما تولد أوصاف غير صحيحة في الواقع. نقترح نموذجا حسابيا مع بنية شرائط للحقيقة تعمل أولا البرامج المستفادة الصغيرة على سلسلة وقت الإدخال، ثم يحدد البرامج / الأنماط التي تمسك بالإدخال المحدد، وأخيرا ظروف * فقط * البرنامج الصحيح الذي تم اختياره (بدلا من ذلك من سلسلة وقت الإدخال) لتوليد وصف نص الإخراج. يتم إنشاء برنامج في طرازنا من الوحدات النمطية، وهي شبكات عصبية صغيرة مصممة لالتقاط الأنماط العددية والمعلومات الزمنية. يتم تقاسم الوحدات النمطية عبر برامج متعددة، مما يتيح التركيبية وكذلك التعلم الفعال لمعلمات الوحدة النمطية. إن الوحدات النمطية، وكذلك تكوين الوحدات النمطية، غير مقصودة في البيانات، ونحن نتعلمهم في أزياء نهاية إلى نهاية مع إشارة التدريب الوحيدة القادمة من أوصاف نص اللغة الطبيعية المصاحبة. نجد أن النموذج المقترح قادر على توليد التسميات التوضيحية عالية الدقة على الرغم من أننا نعتبر مساحة صغيرة وبسيطة من أنواع الوحدات النمطية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح نسخ المتداول من تخصيص Dirichlet الكامن، يسمى Rollinglda. من خلال نهج متتابع، فإنه يتيح بناء سلسلة الزمن القائم على LDA من الموضوعات التي تتفق مع الدول السابقة لنماذج LDA. بعد النمذجة الأولي، يمكن حساب التحديثات بكفاءة، مما يسمح للرصد في الوقت ا لفعلي والكشف عن الأحداث أو الاستراتيجات الهيكلية. لهذا الغرض، نقترح تدابير تشابه مناسبة للموضوعات وتوفير دليل محاكاة على التفوق على النهج الأخرى الشائعة الاستخدام. يتم توضيح كفاية الطريقة الناتجة من خلال تطبيق على مثال Corpus. على وجه الخصوص، نحسب التشابه المتمثل في توزيعات الموضوعات التي تم الحصول عليها بالتتابع على فترات زمنية متتالية. للحصول على مثال تمثيلي، تتكون من مقالات نيويورك تايمز من عام 1980 إلى 2020، نقوم بتحليل تأثير العديد من خيارات المعلمات ضبطها وندير طريقة Rollinglda على مجموعة البيانات الكاملة التي تبلغ حوالي 4 ملايين مادة لإظهار جدوائها.
التحقيق تجارب التحقيق في مدى جعل التمثيل العصبي الممتلكات - مثل جزء من الكلام --- يمكن التنبؤ بها. يشير المرء إلى أن التمثيل يرمز عقار إذا كان التحقيق في هذا التمثيل ينتج دقة أعلى من التحقيق في تمثيل خط أساس مثل تضمين الكلمات غير السياقية. بدلا من اس تخدام خطوط الأساس كنقطة مقارنة، نحن مهتمون بقياس المعلومات الواردة في التمثيل ولكن ليس في الأساس. على سبيل المثال، يمكن للطرق الحالية اكتشافها عندما يكون التمثيل مفيدا أكثر من هوية الكلمة (خط الأساس) للتنبؤ بجزء خطاب؛ ومع ذلك، لا يمكنهم اكتشاف متى تمثل التمثيل من مجرد جوانب جزء من الكلام، ولا يفسره كلمة الهوية. في هذا العمل، نقوم بتوسيع نظرية المعلومات القابلة للاستخدام المسماة معلومات V واقتراح التحقيق الشريطي، والذي ظروف صراحة بشأن المعلومات في الأساس. في دراسة الحالة، نجد أنه بعد تكييفها على أشرطة الكلمات غير السياقية، يمكن الوصول إلى العقارات مثل جزء من الكلام في طبقات أعمق من الشبكة مما كان يعتقد سابقا.
كيفية إنشاء ملخصات من أنماط مختلفة دون مطالبة كوربورا في الأساليب المستهدفة، أو تدريب نماذج منفصلة؟نقدم أساليب رواية يمكن نشرها أثناء فك التشفير الموجز على أي نموذج تلخيص مقرها المحولات المدرب مسبقا.(1) تعديل حالة وحدة فك التشفير يعدل على الفور حالات فك الترميز النهائية مع هدنات النمط المدربين خارجيا، لإثارة تحسين الإخراج مقابل نمط مستهدف.(2) تنبؤ وحدة الكلمة تقييد استخدام كلمة لفرض عنصر تحكم جذاب قوي أثناء التوليد.في تجارب تلخص مع التحكم في البساطة، يجد التقييم التلقائي والقضاة البشري نماذجنا المنتجة للنواتج بلغات أبسط بينما لا تزال مفيدة.ونحن نولد أيضا عناوين الأخبار مع العديد من الميول الإيديولوجية، والتي يمكن تمييزها من قبل البشر مع احتمال معقول.
حظيت نمذجة وتوقع السلاسل الزمنية بأهمية كبيرة في العديد من المجالات التطبيقية كالتنبؤ بالطقس وأسعار العملات ومعدلات استهلاك الوقود والكهرباء، إن توقع السلاسل الزمنية من شأنه أن يزود المنظمات والشركات بالمعلومات الضرورية لاتخاذ القرارات الهامة، وبسبب أهمية هذا المجال من الناحية التطبيقية فإن الكثير من الأعمال البحثية التي جرت ضمنه خلال السنوات الماضية، إضافةً إلى العدد الكبير من النماذج والخوارزميات التي تم اقتراحها في أدب البحث العلمي والتي كان هدفها تحسين كل من الدقة والكفاءة في نمذجة وتوقع السلاسل الزمنية.
أصبحت الرسوم البيانية المستمدة وتعديل الرسوم البيانية من نص اللغة الطبيعية تقنية أساس متعدد الاستخدامات لاستخراج المعلومات مع التطبيقات في العديد من المواد الفرعية، مثل بناء الرسم البياني الدلالي أو المعرفة الرسم البياني. استخدم العمل الأخير هذه التق نية لتعديل الرسوم البيانية المشهد (هو et al. 2020)، من خلال الترميز أولا الرسم البياني الأصلي ثم إنشاء واحد المعدلة بناء على هذا الترميز. في هذا العمل، نوضح أنه يمكننا زيادة الأداء بشكل كبير في هذه المشكلة من خلال صياغة ذلك كملحق رسم بياني بدلا من جيل الرسم البياني. نقترح النموذج الأول لمشكلة امتداد الرسم البياني الناتج استنادا إلى وضع العلامات التسلسل التلقائي. في مجموعات بيانات تعديل الرسم البياني المشهد، يؤدي هذا الصيانة إلى تحسينات في الدقة على أحدث من بين الفنين بين 13 نقطة مئوية 24 نقطة. علاوة على ذلك، نقدم بيانات جديدة مجموعة من المجال الطبي الطبيعي والتي لديها تقلب لغوي أكبر بكثير ورسم رسوم بيانية أكثر تعقيدا من مجموعات بيانات تعديل الرسم البياني المشهد. بالنسبة إلى مجموعة البيانات هذه، فشلت حالة الفن في التعميم، في حين أن طرازنا يمكن أن ينتج تنبؤات ذات مغزى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا