ترغب بنشر مسار تعليمي؟ اضغط هنا

نماذج الموضوعات هي أدوات مفيدة لتحليل وتفسير المواضيع الأساسية الرئيسية للنص الكبير.تعتمد معظم نماذج الموضوعات على حدوث كلمة Word لحساب موضوع، أي مجموعة مرجحة من الكلمات التي تمثل معا مفهوم دلالي رفيع المستوى.في هذه الورقة، نقترح نموذجا جديدا جديدا م ختلفا عن الخفيفة الوزن في الوزن (SNTM) يتعلم سياق غني من خلال تعلم تمثيل موضوعي بالاشتراك من ثلاثة كلمات مشتركة وثيقة تنشأ ثلاثية.تشير نتائجنا التجريبية إلى أن نموذج الموضوع العصبي المقترح لدينا، SNTM، يتفوق على نماذج الموضوعات الموجودة سابقا في مقاييس الاتساق بالإضافة إلى دقة تجميع المستندات.علاوة على ذلك، بصرف النظر عن تماسك الموضوع وأداء التجميع، فإن طراز الموضوع العصبي المقترح لديه عدد من المزايا، وهي، كونها فعالة بشكل حسابي وسهل التدريب.
البحث الحديث في التعدين في الرأي أساليب النمذجة القائم على الكلمات القائمة على الكلمات التي توفر متماسكة متفوقة مقارنة بنمذجة الموضوع التقليدية. في هذه الورقة، نوضح كيف يمكن استخدام هذه الطرق لعرض نماذج موضوع مرتبطة على نصوص الوسائط الاجتماعية باستخد ام SocialVistum، لدينا مجموعة أدوات التصور التفاعلية المقترحة. يعرض رسم بياني مع موضوعات كعقدات وارتباطاتهم كحضب. يتم عرض مزيد من التفاصيل بشكل تفاعلي لدعم استكشاف مجموعات نصية كبيرة، على سبيل المثال، الكلمات والجمل التمثيلية والجمل من المواضيع، وتوزيع الموضوع والشعور، وتجميع موضوعات التسلسل الهرمي، وتسميات موضوعية قابلة للتخصيص وموضوعية محددة مسبقا. تعمل مجموعة الأدوات تلقائيا على البيانات المخصصة للتماسك الأمثل. نعرض مثالا عاما من مجموعة الأدوات على البيانات الزحف من مناقشات وسائل التواصل الاجتماعي الإنجليزية حول استهلاك الأغذية العضوية. تؤكد التصور نتائج دراسة بحثية مستهلكية نوعية. SocialVistum وإجراءات التدريب الخاصة به يمكن الوصول إليها عبر الإنترنت.
أدت مرونة عملية الاستدلال في السيارات الآلية التلقائية (VAES) مؤخرا إلى مراجعة نماذج الموضوعات الاحتمالية التقليدية مما يؤدي إلى نماذج موضوع عصبي (NTM). على الرغم من أن هذه الأساليب حققت نتائج مهمة، فقد تم فعل القليل من العمل بشكل مدهش حول كيفية تفكي ك المواضيع الكامنة. قد يؤدي نماذج الموضوعات الموجودة عند تطبيقها إلى المراجعات إلى استخراج الموضوعات المرتبطة بآراء الكتاب الذاتية المختلطة مع تلك المتعلقة بأوصاف واقعية مثل ملخصات المؤامرة في مراجعات الأفلام والحجز. وبالتالي، من المستحسن فصل مواضيع الرأي تلقائيا من المؤامرة / تلك المحايدة مما يتيح إمكانية الترجمة الترجمة الترجمة في هذه الورقة، نقترح نموذج موضوع عصبي جنبا إلى جنب مع التدريب الخصم لتخفيف موضوعات الرأي من المؤامرة والمحايدين. نقوم بإجراء تقييم تجريبي شامل يقدم مجموعة جديدة من مراجعات الأفلام والحجز المقترفة بأقطارها، وهي بيانات موبو، التي تظهر تماسك محسنة ومجموعة متنوعة من الموضوعات، وهو معدل تحسس متسق، وأداء تصنيف المعنويات متفوقة على نماذج موضوع أخرى تحت إشراف.
أظهر العمل الأخير على تصنيف المعنويات على مستوى جانب جانب الجسبي فعالية دمج الهياكل النحوية مثل أشجار الاعتمادية مع شبكات عصبية رسم بيانية (GNN)، ولكن هذه الأساليب عادة ما تكون عرضة للخطأ في التحليل. لتحسين الاستفادة من المعلومات الأساسية في مواجهة ا لأخطاء التي لا مفر منها، نقترح تقنية رسم بياني بسيطة ولكنها فعالة، Grapmerge، للاستفادة من التنبؤات من المحللين المختلفين. بدلا من تعيين مجموعة واحدة من المعلمات النموذجية إلى كل شجرة التبعية، نقدم أولا علاقات التبعية من يوزعات مختلفة قبل تطبيق GNNS على الرسم البياني الناتج. يسمح هذا نماذج GNN قوية بتحليل الأخطاء دون أي تكلفة حسابية إضافية، ويساعد على تجنب التغلب على التغلب والتجول من تكديس طبقة GNN عن طريق إدخال المزيد من التوصيلية في الرسم البياني للفرقة. تظهر تجاربنا في مهمة Semeval 2014 Task 4 و ACL 14 Twitter أن نموذج Graphmerge الخاص بنا ليس فقط تفوق النماذج مع شجرة الاعتماد الفردي، ولكن أيضا يدق نماذج فرقة أخرى دون إضافة معلمات النموذج.
يمكن أن تصدر نماذج الموضوع العصبي أو استبدال مدخلات كيس الكلمات مع التمثيلات المستفادة من نماذج التنبؤ بكلمة التنبؤ المدربة مسبقا مسبقا. تتمثل إحدى فائدة واحدة عند استخدام التمثيلات من النماذج متعددة اللغات هي أنها تسهل نمذجة موضوع الصلاع اللاحق للصف ر. ومع ذلك، في حين أنه لوحظ على نطاق واسع أن المدينات المدربة مسبقا يجب أن يتم ضبطها بشكل جيد لمهمة معينة، فليس من الواضح على الفور ما يجب أن يبدو الإشراف بهذه المهمة غير المزدوجة مثل نمذجة الموضوع. وبالتالي، نقترح عدة طرق لترميز التركيز الدقيق لتحسين كل من النمذجة النمذجة العصبية أحادية الألوان والصفرية. نحن نفكر في ضبط المهام الإضافية، بناء مهمة تصنيف موضوع جديد، دمج هدف تصنيف الموضوع بشكل مباشر في التدريب النموذجي للموضوع، واستمر التدريب قبل التدريب. نجد أن تمثيل تشفير الترميز بشكل جيد على تصنيف الموضوع وإدماج مهمة تصنيف الموضوع مباشرة في نمذجة موضوع يحسن جودة الموضوع، وأن تمثيل التشفير الدقيق في أي مهمة في أي مهمة هي أهم عامل لتسهيل النقل عبر اللغات.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا