ترغب بنشر مسار تعليمي؟ اضغط هنا

التنبؤ واستخراج الأحداث ذات الطابع الزمني

Fast Mining and Forecasting of Complex Time-Stamped Events

1628   1   68   0 ( 0 )
 تاريخ النشر 2018
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل sohil zidan




اسأل ChatGPT حول البحث

يوجد في الواقع كثير من المسائل تتمثل بنمذجة العلاقات بين الكيانات ثم توقع العلاقات المستقبلية, فمثلاً اقت ارح منتج لزبون معين أو توقع من سيتحدث عن موضوع معين على الشبكة الاجتماعية. يمكن باستخدام هذه الطريقة نمذجة معطيات كثيرة ذات أبعاد عديدة ودمج أكتر من مصدر من البيانات (لنمذجة السياق) مع القدرة على التوسعة, إذ يمكن بشروط معينة جعل التعقيد خطي.


ملخص البحث
تتناول الورقة البحثية المقدمة من سليم فارس ومحمد راشد صبرة موضوع التنبؤ واستخراج الأحداث ذات الطابع الزمني باستخدام طريقة جديدة تسمى TENSORCAST. تهدف هذه الطريقة إلى تحسين دقة التنبؤات في الشبكات الاجتماعية المتطورة زمنياً من خلال دمج مصادر بيانات متعددة في تنسورات متزاوجة. تتميز TENSORCAST بأنها قابلة للتوسع وفعالة، حيث تحقق تحسيناً بنسبة 20% في دقة التنبؤات لأفضل 1000 عضو في المجتمع. تم اختبار الطريقة على شبكات حقيقية مثل DBLP وشبكة تويتر الزمنية، حيث تم التنبؤ بتطور استخدام الهاشتاغات السياسية. تعتمد الطريقة على تحليل التنسور، وهو مصفوفة متعددة الأبعاد، لاكتشاف العوامل الخفية وتقدير القيم المفقودة. تشمل خطوات الطريقة المقترحة تحليل التنسور غير السالب لزوج من التنسورات، توسيع عوامل الزمن، وحساب أكبر K قيمة من التنسور الموسع. تم مقارنة TENSORCAST مع نماذج أخرى مثل CP Forecasting وTrimin، حيث أظهرت تفوقها في عدة جوانب مثل القدرة على التعامل مع معلومات السياق وإدراك الزمن. تعتمد الطريقة على خوارزمية طموحة لإيجاد أكبر عنصر بدمج أرتال العوامل المستخرجة سابقاً، مما يمكن من التنبؤ بالأحداث المستقبلية واكتشاف الاتجاهات البارزة في البيانات الزمنية.
قراءة نقدية
تعتبر الورقة البحثية المقدمة من سليم فارس ومحمد راشد صبرة مساهمة قيمة في مجال التنبؤ واستخراج الأحداث ذات الطابع الزمني باستخدام تحليل التنسور. ومع ذلك، يمكن تقديم بعض الملاحظات النقدية لتحسين العمل. أولاً، قد يكون من المفيد توضيح المزيد من التفاصيل حول كيفية اختيار العوامل الخفية (latent factors) وتأثيرها على دقة التنبؤات. ثانياً، على الرغم من أن الطريقة أثبتت فعاليتها على شبكات حقيقية مثل DBLP وتويتر، إلا أن تطبيقها على نطاق أوسع من البيانات والمجالات المختلفة يمكن أن يضيف قيمة أكبر للعمل. ثالثاً، يمكن تعزيز الورقة بمزيد من التحليل المقارن مع نماذج أخرى مشابهة لتوضيح الفروق الدقيقة في الأداء. وأخيراً، يمكن تحسين العرض البصري للنتائج والخوارزميات لتسهيل فهمها على القراء غير المتخصصين في هذا المجال.
أسئلة حول البحث
  1. ما هي الطريقة الجديدة التي تم تقديمها في الورقة لتحسين دقة التنبؤات في الشبكات الاجتماعية؟

    الطريقة الجديدة التي تم تقديمها هي TENSORCAST، والتي تعتمد على دمج مصادر بيانات متعددة في تنسورات متزاوجة لتحسين دقة التنبؤات.

  2. ما هي المزايا الرئيسية لطريقة TENSORCAST مقارنة بالطرق الأخرى؟

    تتميز TENSORCAST بأنها قابلة للتوسع وفعالة، حيث تحقق تحسيناً بنسبة 20% في دقة التنبؤات لأفضل 1000 عضو في المجتمع، كما أنها قادرة على التعامل مع معلومات السياق وإدراك الزمن.

  3. ما هي البيانات التي تم اختبار طريقة TENSORCAST عليها؟

    تم اختبار طريقة TENSORCAST على شبكات حقيقية مثل DBLP وشبكة تويتر الزمنية، حيث تم التنبؤ بتطور استخدام الهاشتاغات السياسية.

  4. ما هي الخطوات الرئيسية في الطريقة المقترحة لتحليل التنسور؟

    تشمل الخطوات الرئيسية في الطريقة المقترحة تحليل التنسور غير السالب لزوج من التنسورات، توسيع عوامل الزمن، وحساب أكبر K قيمة من التنسور الموسع.


المراجع المستخدمة
Y. Matsubara, Y. Sakurai, C. Faloutsos, T. Iwata, and M. Yoshikawa, “Fast mining and forecasting of complex time-stamped events,” in Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2012, pp. 271–279
M. Araujo, P. Ribeiro, C. Faloutsos. " TensorCast: Forecasting with Context using Coupled Tensors", on IEEE International Conference 2017 on Data Mining (ICDM)
قيم البحث

اقرأ أيضاً

حظيت نمذجة وتوقع السلاسل الزمنية بأهمية كبيرة في العديد من المجالات التطبيقية كالتنبؤ بالطقس وأسعار العملات ومعدلات استهلاك الوقود والكهرباء، إن توقع السلاسل الزمنية من شأنه أن يزود المنظمات والشركات بالمعلومات الضرورية لاتخاذ القرارات الهامة، وبسبب أهمية هذا المجال من الناحية التطبيقية فإن الكثير من الأعمال البحثية التي جرت ضمنه خلال السنوات الماضية، إضافةً إلى العدد الكبير من النماذج والخوارزميات التي تم اقتراحها في أدب البحث العلمي والتي كان هدفها تحسين كل من الدقة والكفاءة في نمذجة وتوقع السلاسل الزمنية.
نقدم في هذا البحث تطبيق جديد للرسوم البيانية لمعامل الديناميكي( DFGs )، و الذي يختص بنمذجة موضوع، تصنيف النص و استرجاع المعلومات.هذه العوامل الديناميكية مصممة لتشكل متتالية من الوثائق ذات الطابع الزمني. اعتماداً على أساس فن معمارية الترميز التلقائي، يتم تدريب نموذج متعدد الطبقات غير الخطي على مراحل باسلوب حكيم لإنتاج أكثر لتمثيلات مدمجة لحقائب الكلمات عند تسوية وثيقة أو فقرة ، و بهذا يؤدي تحميل دلالي. أنو أيضا ديناميكيات زمنية بسيطة مدمجة على التمثيلات الكامنة ، للإستفادة من البنية الهرمية لسلسلة الوثائق، و يمكن بشكل متزامن إنجاز تصنيفات مراقبة أو الانحدار على عناوين الوثيقة،التي يجعل طريقتنا فريدة من نوعها. تعلم هذا النموذج يتم من خلال تعظيم الإمكانية المشتركة للترميز، فك الترميز،معايير ديناميكية موجهة، و من الممكن استخدام الحد الأعظمي لاستنتاج خلفيي معتمدا على التقريب و الانحدار. يمكننا شرح و تفسير أن تخفيض خسارة الانتروبي الموزونة بين رسومات حوادث الكلمة و اعادة بناءها، يتم بتصغير احتمال نموذج الموضوع، و اظهار أن نموذج موضوعنا يحتوي الاحتمالية الأدنى من توزيعات ديريتشمت الكامنة على أنظمة معالجة المعلومات الطبيعية( Neural Information) ( NIPS Processing Systems ) و حالة مجموعات البيانات المشتركة. لنوضح كيف أن القيود الديناميكية تساعد على التعلم بينما يمكننا و يساعدنا هذا على تصور منحى مسار الموضوع .
يبدأ التفكير الاختلافي من بعض الملاحظات ويهدف إلى إيجاد التفسير الأكثر معقولا لهذه الملاحظات. لأداء الاختطاف، غالبا ما يستخدم البشر من الاستدلالات الزمنية والسببية، ومعرفة كيف يمكن أن يؤدي بعض الوضع الافتراضي إلى نتائج مختلفة. يقدم هذا العمل الدراسة الأولى لكيفية تؤثر هذه المعرفة على المهمة NLI المختلة - التي تتكون في اختيار التفسير الأكثر احتمالا لملاحظات معينة. نحن ندرب نموذج اللغة المتخصصة LMI التي يتم تكليفها بإنشاء ما يمكن أن يحدث بعد ذلك من سيناريو افتراضي يتطور من حدث معين. بعد ذلك اقتراح نموذج متعدد المهام MTL لحل المهمة NLI المختلة، والذي يتوقع تفسير معقول من قبل) النظر في الأحداث المحتملة المختلفة الناشئة عن الفرضيات المرشحة - الأحداث الناتجة عن LMI - و B) اختيار واحد أكثر مماثلة إلى النتيجة التي لوحظت. نظهر أن نموذج MTL الخاص بنا يحسن أكثر من LMS من الفانيليا السابقة التي تم تدريبها مسبقا على NLI Paltrack NLI. يشير التقييم والتحليلات اليدوية لدينا إلى أن التعلم عن الأحداث القادمة المحتملة من سيناريوهات افتراضية مختلفة يدعم الاستدلال المختلف.
تهدف هذه الدراسة إلى المقارنة بين نماذج Arima وطريقة التمهيد الأسي بالتنبؤ في السلاسل الزمنية، كما نسلط الضوء على مفاهيم الأساسية الخاصة بمنهجية ARIMA وطريقة التمهيد الأسي. ركزت الدراسة على التنبؤ بالسلاسل الزمنية ذات النطاق الضيق بين نقطة وأخرى ذات نطاق واسع بالاضافة إلى استخدام أطوال مختلفة من فترات التنبؤ وقد تم استخدام معيار RMSE للمقارنة بين الطريقتين.
في هذه الرسالة الأطروحة، نستكشف تطبيق استخراج الأحداث على النصوص الأدبية. بالنظر إلى أطوال أحداث النمذجة الأدبية في التحبيبات المختلفة قد تكون أكثر كافية لاستخراج معلومات ذات معنى، حيث تساهم العناصر الفردية القليل إلى الدلالات الإجمالية. نحن نتكيف مع مفهوم المخططات كسلسلة من الأحداث التي تصف جميعها عملية واحدة، متصلة من خلال المشاركين المشتركين إلى توسعها إلى مخططات متعددة في وثيقة. يتم تقسيم تسلسلات الأحداث في مخططات من خلال نماذج تسلسل الأحداث، في هذه المهمة كهذه المهمة السردية، التنبؤ بالأحداث المفقودة في التسلسل. نقترح بناء على تسلسل تضمين الأحداث لتشكيل شرق المخطط، وبالتالي تلخيص أقسام المستندات باستخدام تمثيل واحد. سيسمح هذا النهج بمقارنات أقسام مختلفة من الوثائق والأعمال الأدبية بأكملها. الأدب هو مجال صعبة يعتمد على مجموعة متنوعة من الأنواع، ولكن تمثيل المحتوى الأدبي قد تلقى اهتماما كبيرا نسبيا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا