ترغب بنشر مسار تعليمي؟ اضغط هنا

نوع نقطة الفائدة التنبؤ باستخدام النص والصور

Point-of-Interest Type Prediction using Text and Images

117   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تنبؤ نوع نقطة الفائدة (POI) هو مهمة استنتاج نوع المكان الذي تم فيه مشاركة مشاركة وسائل التواصل الاجتماعي. إن الاستنتاج من نوع POI مفيد للدراسات في العلوم الاجتماعية الحاسوبية بما في ذلك الاجتماع الاجتماعي، والجيولوجيوسيوس، والجغرافيا الثقافية، ولديه تطبيقات في تكنولوجيات الشبكات الجيولوجية مثل أنظمة التوصية والتصور. الجهود السابقة في التنبؤ بنوع POI التركيز فقط على النص، دون أخذ معلومات مرئية في الاعتبار. ولكن في الواقع، مجموعة متنوعة من الطرائق، فضلا عن علاقاتهم شبهية مع بعضها البعض، شكل التواصل والتفاعلات في وسائل التواصل الاجتماعي. تقدم هذه الورقة دراسة حول التنبؤ بنوع POI باستخدام معلومات متعددة الوسائط من النص والصور المتوفرة في وقت النشر. لهذا الغرض، فإننا نشعر بإثراء البيانات المتاحة حاليا لتنبؤ بنوع POI مع الصور التي ترافق الرسائل النصية. يتم استخراج الأسلوب المقترح لدينا المعلومات ذات الصلة من كل طريقة لالتقاط التفاعلات الفعالة بين النصوص والصورة تحقيق ماكرو F1 من 47.21 من 4 فئات تتفوق بشكل كبير على الطريقة التي من بين الفني للتنبؤ بنوع POI بناء على طرق النص فقط. أخيرا، نقدم تحليلا مفصلا لإلقاء الضوء على التفاعلات عبر الوسائط والقيود المتمثلة في أفضل نموذج أداء لدينا.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أدت نماذج اللغة مثل GPT-2 بشكل جيد على إنشاء جمل سليمة نصنية لمهام إكمال تلقائي للنصوص.ومع ذلك، غالبا ما تتطلب هذه النماذج جهدا تدريبيا كبيرا للتكيف مع مجالات الكتابة المحددة (على سبيل المثال، الطبية).في هذه الورقة، نقترح استراتيجية تدريبية متوسطة لت عزيز أداء نماذج اللغة المدربة مسبقا في مهمة إكمال تلقائي النص وتكييفها بشكل مستقل إلى مجالات محددة.تضم استراتيجيتنا هدفا جديدا للتدريب على الإشراف على الذات يسمى التنبؤ بالعبارة التالية (NPP)، والذي يشجع نموذج اللغة لإكمال الاستعلام الجزئي مع العبارات المخصبة وتحسين أداء الانتهاء التلقائي للنموذج في النهاية.أظهرت التجارب الأولية أن نهجنا قادر على تفوق خطوط الأساس في الإنجاز التلقائي للنطاقات البريدية والكتابة الأكاديمية.
استخدم المتحكم ذو المنطق العائم بهدف ربط النظام الكهروضوئي PV بالشبكة الكهربائية عبر مبدل ثلاثي الطور مقاد (عاكس),إذ يقوم هذا المتحكم بملاحقة نقطة الاستطاعة العظمى وحقن أكبر استطاعة ممكنة من نظام PV إلى الشبكة؛ وذلك عن طريق تحديد زاوية القدح الواجب ت طبيقها على القواطع، و قد اختيرت المتحولات اللغوية حتى يحدد مقدار التغيير في زاوية القدح للمبدل لملاحقة الاستطاعة العظمى.
المعجمات المعجمية ونماذج التنبؤ هي مكون رئيسي في العديد من أنظمة التوليف والتعرف على الكلام. نحن نعلم أن الكلمات ذات الصلة المورفولوجية تتبع عادة نمط ثابت من النطق والذين يمكن وصفها بالنماذج الخاصة باللغة. في هذا العمل، نستكشف مدى استخدام الشبكات الع صبية المتكررة العميقة لتعلم هذا النمط تلقائيا واستغلال هذا النمط لتحسين جودة تنبؤ الكلمات ذات الصلة من خلال انعطاف مورفولوجي. نقترح مقارنتين جديدة لتزويد المعلومات المورفولوجية، باستخدام الطبقة المورفولوجية للكلمة وليمما، والتي يتم تفوحها عادة في المعجم القياسي. نبلغ عن التحسينات عبر عدد من اللغات الأوروبية بدرجات متفاوتة من التعقيد الصوتي والمورفولوجي، وعائلتين لغتان، مع تحسينات أكبر لغات حيث تكون مهمة تنبؤ النطق بطبيعتها أكثر تحديا. ونحن نلاحظ أيضا أن الجمع بين شبكات LSTM ثنائية الاتجاه مع آليات الاهتمام هي نهج عصبي فعال للمشكلة الحسابية التي نظرت، عبر اللغات. يبدو أن نهجنا مفيدا بشكل خاص في إعداد الموارد المنخفض، سواء من تلقاء نفسها وبتعلم التحويل.
استعرضنا في هذا العمل بعض أهم أساليب التنبؤ بالمتسلسلات الزمنية وهي تحليل المتسلسلات الزمنية إلى مركباتها الأساسية (اتجاه عام، موسمية، دورية، عشوائية)، طرائق التمهيد الأسي، نماذج الانحدار الذاتي والمتوسطات المتحركة التكاملية، ثم استعرضنا عدة طرائق هج ينة للتنبؤ، ثم قدمنا طريقة جديدة مقترحة للتنبؤ تعتمد على دمج طريقتي التمهيد الأسي و بوكس-جنكينز وذلك وفق المتوسط الموزون بقيم معايير متوسط الأخطاء المطلق النسبي MAPE لكلا الطريقتين، وطبقنا الطرائق السابقة على ثلاث متسلسلات زمنية موسمية، الأولى متسلسلة درجات الحرارة الجافة ساعياُ في مدينة حلب وذلك في شهر آب للعام 2011 أي طول الدورة الموسمية s=24، والثانية متسلسلة كمية إنتاج الحليب شهرياً في استراليا مقاسة بالرطل لكل بقرة وذلك من شهر كانون الثاني عام 1962 ولغاية شهر كانون الأول عام 1975 أي طول الدورة الموسمية s=12، أما الثالثة متسلسلة كمية الكهرباء المنتجة في استراليا فصلياً وذلك في الفترة الممتدة من آذار 1956 ولغاية أيلول للعام 1994 أي طول الدورة الموسمية s=4، وقارننا النتائج التي توصلنا إليها فكانت أفضل طريقة للتنبؤ هي الطريقة المقترحة.
مع وجود شعبية متزايدة للمتحدثين الذكية، مثل الأمازون اليكسا، أصبح الكلام أحد أهم طرق التفاعل بين الإنسان والحاسوب. يمكن القول إن التعرف التلقائي على التعرف على الكلام (ASR) هو العنصر الأكثر أهمية في هذه الأنظمة، حيث ينتشر أخطاء في التعرف على الكلام إ لى مكونات المصب التي تتحلل بشكل كبير من تجربة المستخدم. طريقة بسيطة وفعالة لتحسين دقة التعرف على الكلام هي تطبيق ما بعد المعالج التلقائي نتيجة التعرف. ومع ذلك، فإن التدريب على معالج ما بعد البيع يتطلب شركة موازية تم إنشاؤها بواسطة Annwotators البشرية، وهي مكلفة وغير قابلة للتحجيم. لتخفيف هذه المشكلة، نقترح النسخ الخلفي (BTS)، وهي طريقة قائمة على الدنيوية التي يمكن أن تنشئ مثل هذه الشركة دون عمل بشري. باستخدام CORPUS RAW، يقوم BTS بتلف النص باستخدام أنظمة تحويل النص إلى كلام (TTS) ونص الكلام إلى النص (STT). بعد ذلك، يمكن تدريب نموذج ما بعد المعالجة على إعادة بناء النص الأصلي مع إعطاء المدخلات التالفة. تبين التقييمات الكمية والنوعية أن المعالج بعد المعالج المدرب باستخدام نهجنا فعال للغاية في إصلاح أخطاء التعرف على الكلام غير تافهة مثل سوء الكلمات الأجنبية. نقدم Corpus الموازي الذي تم إنشاؤه ومنصة ما بعد المعالجة لجعل نتائجنا متاحة للجمهور.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا