ترغب بنشر مسار تعليمي؟ اضغط هنا

تضمينات التعلم من أجل كلمات نادرة الاستفادة من محرك البحث عن الإنترنت وعلاقات الموقع المكاني

Learning Embeddings for Rare Words Leveraging Internet Search Engine and Spatial Location Relationships

649   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعتمد تقنيات AdgeDDing Word بشدة على ترددات الكلمات في Corpus، وتتأثر سلبا بفشل في تقديم تمثيلات موثوقة للكلمات ذات التردد المنخفض أو الكلمات غير المرئية أثناء التدريب. لمعالجة هذه المشكلة، نقترح خوارزمية لتعلم Admeddings عن الكلمات النادرة على أساس محرك بحث الإنترنت وعلاقات الموقع المكاني. خوارزميتنا عائدات في خطوتين. نقوم أولا باسترجاع صفحات الويب المقابلة للكلمة النادرة من خلال محرك البحث وتحليل النتائج المرسلة لاستخراج مجموعة من أكثر الكلمات ذات الصلة. نحن متوسط ​​ناقلات الكلمات ذات الصلة باعتبارها المتجه الأولي للكلمة النادرة. بعد ذلك، فإن موقع الكلمة النادرة في مساحة المتجه يتم ضبطه بشكل متكرر وفقا لترتيب ما له في الكلمات ذات الصلة. بالمقارنة مع النهج الأخرى، يمكن للخوارزمية لدينا معرفة تمثيلات أكثر دقة لمجموعة واسعة من المفردات. نقوم بتقييم شركاتنا النادرة المستفادة من الكلمات النادرة على مهمة كلمة متعلقة، وتظهر النتائج التجريبية أن خوارزميتنا تحقق الأداء الحديث من بين الفن.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

1532 - Google 2015 كتاب
أساسيات محسن محركات البحث - انشاء عناوين صفحات فريدة ودقيقة - تحسين بنية الموقع - تحسين المحتوى - التعامل مع برامج الزحف - تحسين محركات البحث لهواتف الجوال - التحليلات وعمليات الترويج
على الرغم من وجود العديد من الدراسات حول توليد اللغة العصبية (NLG)، إلا أن القليل من التجارب يتم وضعها في العالم الحقيقي، وخاصة في مجال الإعلان.يمكن أن تساعد توليد الإعلانات مع نماذج NLG في تصفيات الأوجه في إنشائها.ومع ذلك، قامت دراسات قليلة بتقييم ت أثير الإعلانات التي تم إنشاؤها بشكل كاف مع وجود خدمة فعلية مضمنة لأنها تتطلب كمية كبيرة من بيانات التدريب وبيئة معينة.في هذه الورقة، نوضح حالة الاستخدام العملي لتوليد نص الإعلان بنموذج NLG.خصيصا، نعرض كيفية تحسين تأثير الإعلانات، ونشر النماذج إلى منتج، وتقييم الإعلانات التي تم إنشاؤها.
في الآونة الأخيرة، أصبح البحث برعاية واحدة من أكثر القنوات المربحة للتسويق. كأساس أساسي للبحث المدعى عليه، اجتذبت النمذجة ذات الصلة الاهتمام المتزايد بسبب القيمة العملية الهائلة. معظم الطرق الحالية تعتمد فقط على أزواج الكلمات الرئيسية للاستعلام. ومع ذلك، عادة ما تكون الكلمات الرئيسية عادة نصوص قصيرة مع معلومات دلالية ندرة، والتي قد لا تعكس بدقة النوايا الإعلانية الأساسية. في هذه الورقة، نقوم بالتحقيق في مشكلة الرواية في النمذجة ذات الصلة بالمعلن، والتي ترفف معلومات المعلنين لسد الفجوة بين نوبة البحث وأغراض الإعلان. يكمن دوافعنا في دمج سلوكيات العطاءات غير المزودة بحيث تكون الرسوم البيانية التكميلية لتعلم تمثيلات معلنة مرغوبة. قد نقترح مزيدا من الرسوم البيانية المزايدة في الرسم البياني المعزز بنموذج BGTR مع ثلاثة أبراج لصمامات الرسوم البيانية العطاءات والبيانات النصية الدلالية. تجريبيا، نقوم بتقييم نموذج BGTR عبر مجموعة بيانات كبيرة، والنتائج التجريبية تظهر باستمرار تفوقها.
الاعتراف بالكيانات المسماة في استفسارات محرك البحث القصيرة هي مهمة صعبة بسبب معلومات السياق الأضعف مقارنة بالجمل الطويلة.فشلت أنظمة التعرف على الكيان المسماة القياسية (NER) التي يتم تدريبها على الجمل الصحيحة والطويلة بشكل جيد على أداء هذه الاستفسارات بشكل جيد.في هذه الدراسة، نشارك جهودنا نحو إنشاء مجموعة بيانات تنظيفها ومصممة من استفسارات محرك البحث التركية الحقيقية (TR-SEQ) وإدخال ملصق ممت طويل لإرضاء احتياجات محرك البحث.يتم تدريب نظام NER من خلال تطبيق أحدث طريقة التعلم العميقة من أحدث برت إلى البيانات التي تم جمعها وإبلاغ أدائها العالي على استعلامات محرك البحث.علاوة على ذلك، قمنا بمقارنة نتائجنا مع أنظمة NER التركية التي من بين الفن.
التعلم الإشرافه يفترض أن ملصق الحقيقة الأرض موجود.ومع ذلك، فإن موثوقية هذه الحقيقة الأرضية تعتمد على المنشآت البشرية، التي لا توافق في كثير من الأحيان.وقد أظهر العمل السابق أن هذا الخلاف يمكن أن يكون مفيدا في نماذج التدريب.نقترح طريقة جديدة لدمج هذا الخلاف كمعلومات: بالإضافة إلى حساب الأخطاء القياسي، نستخدم التسميات الناعمة (أي توزيعات الاحتمالات على الملصقات Annotator) كملقمة مساعدة في شبكة عصبية متعددة المهام.نقيس الاختلاف بين التنبؤات والملصقات الناعمة المستهدفة مع العديد من وظائف الخسائر وتقييم النماذج على مهام NLP المختلفة.نجد أن المهمة الإضافية للتنبؤ بالعلامة الناعمة تقلل من عقوبة الأخطاء بشأن الكيانات الغامضة، وبالتالي تخفف من التجول.يحسن بشكل كبير الأداء عبر المهام، بما يتجاوز النهج القياسي والعمل السابق.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا