ترغب بنشر مسار تعليمي؟ اضغط هنا

الاعتراف بالكيانات المسماة في استفسارات محرك البحث القصيرة هي مهمة صعبة بسبب معلومات السياق الأضعف مقارنة بالجمل الطويلة.فشلت أنظمة التعرف على الكيان المسماة القياسية (NER) التي يتم تدريبها على الجمل الصحيحة والطويلة بشكل جيد على أداء هذه الاستفسارات بشكل جيد.في هذه الدراسة، نشارك جهودنا نحو إنشاء مجموعة بيانات تنظيفها ومصممة من استفسارات محرك البحث التركية الحقيقية (TR-SEQ) وإدخال ملصق ممت طويل لإرضاء احتياجات محرك البحث.يتم تدريب نظام NER من خلال تطبيق أحدث طريقة التعلم العميقة من أحدث برت إلى البيانات التي تم جمعها وإبلاغ أدائها العالي على استعلامات محرك البحث.علاوة على ذلك، قمنا بمقارنة نتائجنا مع أنظمة NER التركية التي من بين الفن.
تعتمد تقنيات AdgeDDing Word بشدة على ترددات الكلمات في Corpus، وتتأثر سلبا بفشل في تقديم تمثيلات موثوقة للكلمات ذات التردد المنخفض أو الكلمات غير المرئية أثناء التدريب. لمعالجة هذه المشكلة، نقترح خوارزمية لتعلم Admeddings عن الكلمات النادرة على أساس محرك بحث الإنترنت وعلاقات الموقع المكاني. خوارزميتنا عائدات في خطوتين. نقوم أولا باسترجاع صفحات الويب المقابلة للكلمة النادرة من خلال محرك البحث وتحليل النتائج المرسلة لاستخراج مجموعة من أكثر الكلمات ذات الصلة. نحن متوسط ​​ناقلات الكلمات ذات الصلة باعتبارها المتجه الأولي للكلمة النادرة. بعد ذلك، فإن موقع الكلمة النادرة في مساحة المتجه يتم ضبطه بشكل متكرر وفقا لترتيب ما له في الكلمات ذات الصلة. بالمقارنة مع النهج الأخرى، يمكن للخوارزمية لدينا معرفة تمثيلات أكثر دقة لمجموعة واسعة من المفردات. نقوم بتقييم شركاتنا النادرة المستفادة من الكلمات النادرة على مهمة كلمة متعلقة، وتظهر النتائج التجريبية أن خوارزميتنا تحقق الأداء الحديث من بين الفن.
على الرغم من وجود العديد من الدراسات حول توليد اللغة العصبية (NLG)، إلا أن القليل من التجارب يتم وضعها في العالم الحقيقي، وخاصة في مجال الإعلان.يمكن أن تساعد توليد الإعلانات مع نماذج NLG في تصفيات الأوجه في إنشائها.ومع ذلك، قامت دراسات قليلة بتقييم ت أثير الإعلانات التي تم إنشاؤها بشكل كاف مع وجود خدمة فعلية مضمنة لأنها تتطلب كمية كبيرة من بيانات التدريب وبيئة معينة.في هذه الورقة، نوضح حالة الاستخدام العملي لتوليد نص الإعلان بنموذج NLG.خصيصا، نعرض كيفية تحسين تأثير الإعلانات، ونشر النماذج إلى منتج، وتقييم الإعلانات التي تم إنشاؤها.
يتضمن هذا البحث بناء نواة محرك بحث يمكنه العمل ضمن شبكة الانترنت , قادر على التحكم بالبحث عن معلومات بمجالات محددة و فهرسة مواقع معينة . تم في هذا البحث دراسة مسألة البحث عن المعلومات عبر الانترنيت و نظم استرجاع المعلومات و أنواع محركات البحث و المع ماريات الأساسية لبناء المحركات و من ثم اقتراح معمارية محرك بحث يصلح نواة لمحرك البحث المرغوب و تحديد المخطط النهائي لمعمارية محرك البحث حيث تم بناء مقاطع محرك البحث و إجراء الاختبارات و النتائج.
من أجل مواكبة التقدم الهائل لثورة المعلومات و توفرها على الوب تم وضع طرق و اقتراحات من أجل تحسين فعالية عمليات البحث, معظم هذه الحلول ركزت على خوارزميات ترتيب الصفحات (Page Ranking) و معدل تردد الكلمة (Term Freq. ) و لكن التركيز على استخدام علم دلالا ت الألفاظ و علاقة دلالات الألفاظ مع المحتوى رغم أهميته الكبرى ما زال قليلاً لأسباب مختلفة. يهدف هذا البحث لإيجاد تصميم محرك بحث يعتمد على علم دلالات الألفاظ Semantics) ( يمكن استخدامه للوصول إلى المعلومات ذات الطبيعة غير البنيوية مثل صفحات الوب, و يساعد في تحسين دقة و فعالية عملية البحث. تم إجراء مجموعة من الاختبارات لاستنتاج تصميم محرك البحث و تقييم نتائج استخدام علم دلالات الألفاظ في التعامل مع عمليات البحث على صفحات الوب.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا