ترغب بنشر مسار تعليمي؟ اضغط هنا

UL2C: رسم الخرائط مواقع المستخدمين إلى دول على Twitter العربي

UL2C: Mapping User Locations to Countries on Arabic Twitter

209   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يمكن أن يكون تعيين مواقع المستخدمين إلى البلدان مفيدا للعديد من التطبيقات مثل تحديد الهدوء ومجموعات المؤلف ونظام التوصية وما إلى ذلك. يسمح Twitter للمستخدمين بإعلان مواقعهم كنصا مجانيا، وغالبا ما تكون هذه المواقع المعلنة من المستخدم صاخبة وصعبة للغاية.في هذه الورقة، نقدم أكبر مجموعة بيانات المسمى يدويا لعودة مواقع المستخدمين على Twitter العربي إلى بلدانهم المقابلة.نبني نماذج تعليمية فعالة من الآلات التي يمكنها أتمتة هذا التعيين كفاءة أفضل بكثير مقارنة بمكتبات مثل Geopy.نظهر أيضا أن DataSet لدينا أكثر فعالية من البيانات المستخرجة من قاعدة بيانات Geonames الجغرافية في هذه المهمة حيث يغطي الأخير المواقع المكتوبة بطرق رسمية فقط.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نستكشف مقاربة عصبية بسيطة للغاية لتعيين تقويم الإملاءات إلى النسخ الصوتي في سياق منخفض الموارد.الفكرة الأساسية هي البدء من نظام أساسي وتركيز جميع الجهود بشأن تكبير البيانات.سوف نرى أن بعض التقنيات تعمل، ولكن البعض الآخر لا.
غالبا ما تكون دراسات العلوم الاجتماعية الحاسوبية تحليل المحتوى في كثير من الأحيان داخل التركيبة السكانية القياسية.نظرا لأن التركيبة السكانية غير متوفرة على العديد من منصات وسائل التواصل الاجتماعي (E.G. Twitter)، فقد استنتجت الدراسات العديد من الدراسا ت التركيبة السكانية تلقائيا.على الرغم من العديد من الدراسات التي تقدم أداء مفهوم العرق والعرق، لا يزال تدريب النظم العملية بعيد المنال لأن هناك بعض البيانات المشروح.مجموعات البيانات الحالية صغيرة وغير دقيقة، أو تفشل في تغطية المجموعات العرقية والأعرقية الأربعة الأكثر شيوعا في الولايات المتحدة.نقدم طريقة لتحديد التقارير الذاتية عن العرق والعرق من أوصاف الملف الشخصي Twitter.على الرغم من ضجيج الإشراف الآلي، فإن مجموعات بيانات التقرير الذاتي لدينا تمكن التحسينات في أداء التصنيف على بيانات مسح التقارير الذاتية القياسية الذهبية.والنتيجة هي طريقة استنساخ لإنشاء موارد تدريبية واسعة النطاق للسباق والعرق.
تقارير الورقة عن المنهجية والنتائج النهائية لرسم خرائط مركدة واسعة النطاق بين plwordnet و princeton wordnet.يتم وصف إجراءات رسم الخرائط اليدوية والمخصصة نصف التلقائي بالإضافة إلى أنواع العلاقات المشترية للأسماء والأفعال والصفات والأحوال.كما يتم توفير إحصاءات جميع أنواع العلاقات المشترية.
تعتمد أنظمة متعددة اللغات متعددة اللغات على المفردات المشتركة التي تغطي جميع اللغات التي تغطي بما فيه الكفاية. تحقيقا لهذه الغاية، فإن النهج البسيط والمستعمل بشكل متكرر يستفيد من مفهليات الكلمات الفرعية التي تم إنشاؤها بشكل مشترك على عدة لغات. نحن نف ترض أن مثل هذه المفردات هي فرعية نفسها بسبب الإيجابيات الخاطئة (الكلمات الفرعية المماثلة مع معاني مختلفة عبر اللغات) والسلبيات الخاطئة (كلمات فرعية مختلفة مع معاني مماثلة). لمعالجة هذه المشكلات، نقترح رسم الخرائط عن طريق الكلمات الفرعية ومثبتة عبر اللغات (SMALA)، وهي طريقة لبناء مخصصات الكلمات الفرعية ثنائية اللغة. تقوم SMALA باستخراج محاذاة الكلمات الفرعية باستخدام تقنية رسم الخرائط غير المزودة بعملية رسم الخرائط واستخدامها لإنشاء مراسي عبر اللغات بناء على أوجه تشابه الكلمات الفرعية. نوضح فوائد SMALA للاستدلال اللغوي للغة الطبيعية المتبادلة (XNLI)، حيث يحسن تحويل صفرية إلى لغة غير مرئية دون بيانات مهمة، ولكن فقط من خلال تقاسم تضييق الكلمات الفرعية. علاوة على ذلك، في الترجمة الآلية العصبية، نوضح أن مفردات الكلمة الفرعية المشتركة التي تم الحصول عليها مع Smala تؤدي إلى أعلى درجات بلو على أحكام تحتوي على العديد من الإيجابيات الخاطئة والسلبيات الخاطئة.
أسماء ومعرفات المراقبة المنطقية (LOINC) هي مجموعة قياسية من الرموز التي تمكن الأطباء من التواصل حول الاختبارات الطبية.تعتمد المختبرات على Loinc لتحديد ما تختبر طلبات الطبيب للمريض.ومع ذلك، غالبا ما يستخدم الأطباء رموز مخصصة خاصة بالموقع في أنظمة السج لات الطبية التي يمكن أن تشمل اختلافا بالاختصار والأخطاء الإملائية واخترع المختصرات.يجب أن يتم تعيين حلول البرمجيات من هذه الرموز المخصصة إلى معيار Loinc لدعم قابلية التشغيل البيني للبيانات.التحدي الرئيسي هو أن لوينك تتألف من ستة عناصر.التعيين لا يتطلب عدم استخراج هذه العناصر فحسب، بل يجمع بينها أيضا وفقا لمنطق Loinc.وجدنا أن التعلم العميق القائم على الطابع يتفوق عند استخراج عناصر Loinc بينما تكون الأساليب القائمة على المنطق أكثر فعالية للجمع بين هذه العناصر في قيم Loinc كاملة.في هذه الورقة، نقدم مجموعة من التعلم والمنطق والمنطق المستخدم حاليا في العديد من المرافق الطبية في الخريطة من

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا