ترغب بنشر مسار تعليمي؟ اضغط هنا

تطبيق لنمذجة موضوع وثائق ذات طابع زمني و تطبيق ذلك على الخوارزميات

Application to Topic Modeling of Time- Stamped Documents and apply that for Algorithms

1768   0   10   0 ( 0 )
 تاريخ النشر 2014
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم في هذا البحث تطبيق جديد للرسوم البيانية لمعامل الديناميكي( DFGs )، و الذي يختص بنمذجة موضوع، تصنيف النص و استرجاع المعلومات.هذه العوامل الديناميكية مصممة لتشكل متتالية من الوثائق ذات الطابع الزمني. اعتماداً على أساس فن معمارية الترميز التلقائي، يتم تدريب نموذج متعدد الطبقات غير الخطي على مراحل باسلوب حكيم لإنتاج أكثر لتمثيلات مدمجة لحقائب الكلمات عند تسوية وثيقة أو فقرة ، و بهذا يؤدي تحميل دلالي. أنو أيضا ديناميكيات زمنية بسيطة مدمجة على التمثيلات الكامنة ، للإستفادة من البنية الهرمية لسلسلة الوثائق، و يمكن بشكل متزامن إنجاز تصنيفات مراقبة أو الانحدار على عناوين الوثيقة،التي يجعل طريقتنا فريدة من نوعها. تعلم هذا النموذج يتم من خلال تعظيم الإمكانية المشتركة للترميز، فك الترميز،معايير ديناميكية موجهة، و من الممكن استخدام الحد الأعظمي لاستنتاج خلفيي معتمدا على التقريب و الانحدار. يمكننا شرح و تفسير أن تخفيض خسارة الانتروبي الموزونة بين رسومات حوادث الكلمة و اعادة بناءها، يتم بتصغير احتمال نموذج الموضوع، و اظهار أن نموذج موضوعنا يحتوي الاحتمالية الأدنى من توزيعات ديريتشمت الكامنة على أنظمة معالجة المعلومات الطبيعية( Neural Information) ( NIPS Processing Systems ) و حالة مجموعات البيانات المشتركة. لنوضح كيف أن القيود الديناميكية تساعد على التعلم بينما يمكننا و يساعدنا هذا على تصور منحى مسار الموضوع .


ملخص البحث
يقدم هذا البحث تطبيقًا جديدًا للرسوم البيانية للعامل الديناميكي (DFGs) في نمذجة الموضوع، تصنيف النص، واسترجاع المعلومات. يعتمد النموذج على معمارية المرمز التلقائي، حيث يتم تدريب نموذج متعدد الطبقات غير الخطي على مراحل لإنتاج تمثيلات مدمجة لحقائب الكلمات على مستوى الوثيقة أو الفقرة، مما يؤدي إلى تحليل دلالي. يتضمن النموذج أيضًا ديناميكيات زمنية بسيطة على التمثيلات الكامنة، مما يستفيد من البنية الهرمية لسلسلة الوثائق، ويمكنه بشكل متزامن إنجاز تصنيفات مراقبة أو انحدار على عناوين الوثيقة. يتم تعلم النموذج من خلال تعظيم الإمكانية المشتركة للترميز، فك الترميز، المعايير الديناميكية الموجهة، ومن الممكن استخدام الحد الأعظمي للاستنتاج الخلفي المعتمد على التقريب والانحدار. يوضح البحث أن تخفيض خسارة الانتروبى الموزونة بين رسومات حوادث الكلمة وإعادة بنائها يتم بتصغير احتمال نموذج الموضوع، ويظهر أن النموذج يحقق احتمالية أقل من توزيعات ديرينشلت الكامنة على مجموعات بيانات NIPS وحالة الاتحاد. كما يوضح كيف تساعد القيود الديناميكية على التعلم وتصور منحى مسار الموضوع.
قراءة نقدية
دراسة نقدية: يقدم البحث مساهمة قيمة في مجال نمذجة الموضوع واسترجاع المعلومات باستخدام الرسوم البيانية للعامل الديناميكي والمرمزات التلقائية. ومع ذلك، يمكن أن تكون هناك بعض النقاط التي تحتاج إلى مزيد من التوضيح أو التحسين. على سبيل المثال، قد يكون من المفيد تقديم مزيد من التفاصيل حول كيفية اختيار المعلمات المختلفة للنموذج وكيفية تأثيرها على الأداء. بالإضافة إلى ذلك، قد يكون من المفيد تقديم مقارنة أكثر تفصيلية مع النماذج الأخرى الموجودة في الأدبيات لتوضيح الفوائد الفعلية للنموذج المقترح. وأخيرًا، يمكن أن يكون هناك اهتمام أكبر بتطبيقات النموذج في مجالات أخرى غير تحليل النصوص، مثل تحليل الصور أو البيانات الزمنية الأخرى.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من هذا البحث؟

    الهدف الرئيسي هو تقديم تطبيق جديد للرسوم البيانية للعامل الديناميكي في نمذجة الموضوع، تصنيف النص، واسترجاع المعلومات.

  2. ما هي التقنية الأساسية المستخدمة في هذا البحث؟

    التقنية الأساسية المستخدمة هي المرمز التلقائي متعدد الطبقات غير الخطي.

  3. كيف يتم تعلم النموذج المقترح؟

    يتم تعلم النموذج من خلال تعظيم الإمكانية المشتركة للترميز، فك الترميز، المعايير الديناميكية الموجهة، باستخدام الحد الأعظمي للاستنتاج الخلفي المعتمد على التقريب والانحدار.

  4. ما هي الفائدة الرئيسية من استخدام القيود الديناميكية في النموذج؟

    القيود الديناميكية تساعد على التعلم وتصور منحى مسار الموضوع، مما يعزز من فهم البنية الهرمية لسلسلة الوثائق.


المراجع المستخدمة
Deerwester, S., Dumais, S., Furnas, G., Landauer, T. and Harshman, R.(1990). Indexing by latent semantic analysis. Journal of the American Society for Information Science 41, 391–407
Kolenda, T. and Kai Hansen, L. (2000). Independent components in text. In Advances in Independent Component Analysis
Gehler, P., Holub, A. and Welling, M. (2006). The rate adapting poisson model for information retrieval and object recognition. In ICML
Salakhutdinov, R. and Hinton, G. (2009). Replicated softmax. In ICML
Blei, D., Ng, A. and Jordan, M. (2003). Latent dirichlet allocation. Journal of Machine Learning Research 3, 993–1022
قيم البحث

اقرأ أيضاً

يهدف البحث بشكل رئيسي إلى دراسة أسلوب المقارنة المرجعية ككوسيلة للتحسين المستمر للجودة و إمكانية تطبيقه في المصارف السورية, و التعرف على صعوبات التطبيق لإيجاد الحلول المناسبة.
تطبق هذه الورقة نمذجة الموضوع لفهم موضوعات صحة الأم والاهتمامات والأسئلة المعبرين عنها في المجتمعات عبر الإنترنت على مواقع الشبكات الاجتماعية.ندرس تحليل Dirichlet الكامن (LDA) وطريقين حديثين: نموذج موضوع عصبي مع تقطير المعرفة (KD) ونموذج الموضوع المد مج (ETM) على نصوص صحة الأم يتم جمعها من Reddit.يتم تقييم النماذج على جودة موضوع الاستدلال والموضوع، باستخدام مقاييس التقييم التلقائي والتقييم البشري.نحن نحلل قطع اتصال بين المقاييس التلقائية والتقييمات البشرية.في حين أن LDA يؤدي الأفضل بشكل عام مع مقاييس التقييم التلقائي NPMI والتماسك، فإن نموذج الموضوع العصبي مع تقطير المعرفة مواتية من خلال تقييم الخبراء.ونحن أيضا إنشاء خبير جديد جزئيا مشروح موضوع صحة الأم
يوجد في الواقع كثير من المسائل تتمثل بنمذجة العلاقات بين الكيانات ثم توقع العلاقات المستقبلية, فمثلاً اقت ارح منتج لزبون معين أو توقع من سيتحدث عن موضوع معين على الشبكة الاجتماعية. يمكن باستخدام هذه الطريقة نمذجة معطيات كثيرة ذات أبعاد عديدة ودمج أكت ر من مصدر من البيانات (لنمذجة السياق) مع القدرة على التوسعة, إذ يمكن بشروط معينة جعل التعقيد خطي.
شفافية إفصائية أوسع --- الحقيقة والوضوح في مجال الاتصالات فيما يتعلق بوظائف منظمة العفو الدولية --- تعتبر على نطاق واسع مرغوب فيه. لسوء الحظ، إنه مفهوم غامض، يصعب تحديده وقياسه. هذا هو الإشكارات، كما أظهر العمل السابق مفاضلات محتملة وعواقب سلبية للإف صاح عن الشفافية، مثل تأثير الالتباس، حيث تفهم الكثير من المعلومات "فهم القارئ لما يعني وصف النظام. لقد جعلت الطبيعة الشخصية الشفافية الإفصائية دراسة عميقة في هذه المشكلات وعلاجاتهم صعبة. لتحسين هذه الحالة، نقدم مقاييس احتمالية النموذج العصبي النموذجي النموذجي مباشرة من الشفافية الكشفية، وإظهار أنهم يرتبطون بالمستخدم وفكرات الخبراء من شفافية النظام، مما يجعلهم وكيلا موضوعيا صالحا. أخيرا، نوضح استخدام هذه المقاييس في دراسة تجريبية يحدد العلاقات بين الشفافية والارتباك وتصورات المستخدمين في كائن من أوصاف نظام NLP الحقيقي.
تسمح تطبيقات التفاعل في إزاحة الوقت (TOIA) بمحاكاة المحادثات مع الأشخاص الذين سجلوا كلمات الفيديو ذات الصلة مسبقا، والتي يتم لعبها استجابة لمستخدمها التفاعل.لدى Toias إمكانات كبيرة للحفاظ على التواريخ عبر الأجيال والثقافية، والتدريس عبر الإنترنت، وال مقابلات المحاكاة، وما إلى ذلك. توجد Toias الحالية في السياقات المتخصصة التي تنطوي على تكاليف إنتاج عالية.تقدم الديمقراطية TOIA تحديات مختلفة عند إنشاء التسجيلات السابقة المناسبة، وتصميم قصص مستخدم مختلفة، وإنشاء واجهات بسيطة عبر الإنترنت للتجريب.نقوم بفتح المصدر TOIA 2.0، وهو تطبيق تفاعل متوفع للوقت الذي تركز على المستخدم، وجعله متاحا لكل من يريد التفاعل مع التسجيلات السابقة للأشخاص، أو إنشاء تسجيلات مسبقة الدفع.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا