ترغب بنشر مسار تعليمي؟ اضغط هنا

معظم أساليب الإجابة على الأسئلة القائمة على المعرفة الحالية (KBQA) تعلم أولا تعيين السؤال المحدد في رسم بياني للاستعلام، ثم قم بتحويل الرسم البياني إلى استعلام قابل للتنفيذ للعثور على الإجابة.عادة ما يتم توسيع الرسم البياني للاستعلام تدريجيا من كيان الموضوع بناء على نموذج تنبؤ التسلسل.في هذه الورقة، نقترح حل جديد للاستعلام عن جيل الرسم البياني الذي يعمل بالطريقة المعاكسة: نبدأ مع قاعدة المعرفة بأكملها وتقليصها تدريجيا إلى الرسم البياني للاستعلام المرغوب فيه.يعمل هذا النهج على تحسين كفاءة ودقة جيل الرسم البياني للاستعلام، خاصة بالنسبة لأسئلة قفز متعددة المعقدة.تظهر النتائج التجريبية أن طريقتنا تحقق أداء حديثة على مجموعة بيانات ComplexwebQuestion (CWQ).
يقترح إعادة كتابة الاستعلام (QR) حل مشكلة عدم تطابق الكلمة بين الاستفسارات والمستندات في البحث على الويب. الأساليب الحالية عادة ما نموذج QR مع نموذج تسلسل نهاية إلى نهاية (SEQ2SEQ). يمكن أن تتعلم النماذج القائمة على المحولات الحديثة بفعالية دلالات نص ية من سجلات جلسة المستخدم، لكنها غالبا ما تتجاهل معلومات الموقع الجغرافي للمستخدمين الحيوية لتحقيق البحث عن نقطة الفائدة (POI) على خدمات الخريطة. في هذه الورقة، اقترحنا نموذجا ما قبل التدريب، يسمى GEO-BERT، لدمج الدلالات والمعلومات الجغرافية في التمثيلات المدربة مسبقا للويس. أولا، نحاكي توزيع POI في العالم الحقيقي كشركة رسم بياني، حيث تمثل العقد Pois ومتعدد الحبيبات الجغرافية. ثم نستخدم أساليب تعلم التمثيل الرسم البياني للحصول على تمثيلات جغرافية. أخيرا، نحن ندرب نموذجا ما قبل التدريب يشبه بيرت مع تضيير الرسوم البيانية النصية والنصية للحصول على تمثيل متكامل لكل من المعلومات الجغرافية والدلية، وتطبيقه في البحث عن QR of POI. يحقق النموذج المقترح دقة ممتازة على مجموعة واسعة من مجموعات بيانات خريطة العالم الواقعية.
أدى فجر العصر الرقمي إلى زيادة متطلبات موارد البحوث الرقمية، والتي يجب معالجتها بسرعة ومعالجتها بواسطة أجهزة الكمبيوتر.نظرا لكمية البيانات التي تم إنشاؤها بواسطة عملية الرقمنة هذه، أصبح تصميم الأدوات التي تمكن تحليل وإدارة البيانات والبيانات الوصفية موضوعا ذا صلة.في هذا السياق، يساهم الكائنات متعددة اللغات من استبيانات المسح (MCSQ) في إنشاء وتوزيع البيانات للعلوم والإعلان الاجتماعي (SSH) بعد مبادئ عادلة (غير قابلة للتحقيق، غير قابلة للوصول، قابل للتشغيل القابلة لإعادة الاستخدام)، وتوفر وظائف للمستخدمين النهائيينلا يعرف ذلك البرمجة من خلال واجهة سهلة الاستخدام.بمجرد تطبيق المرشحات المرغوبة في واجهة الرسم، يمكن للمستخدمين إنشاء موارد لغوية لمناطق البحث والترجمة، مثل ذكريات الترجمة، وبالتالي تسهيل الوصول إلى البيانات واستخدامها.
تصف هذه الورقة نموذجا مدمجا وفعالا لاسترجاع مرور الكمون المنخفض في البحث عن المحادثة بناء على تمثيلات كثيفة علمية. قبل عملنا، يستخدم النهج الواحد من بين الفنون خط أنابيب متعدد المراحل يشتمل على وحدات إعادة صياغة استعلام محادثة واسترجاع المعلومات. على الرغم من فعاليته، غالبا ما يتضمن هذا الخط الأنابيب نماذج عصبية متعددة تتطلب أوقات الاستدلال الطويلة. بالإضافة إلى ذلك، تحسين كل وحدة بشكل مستقل يتجاهل التبعيات بينهم. لمعالجة هذه العيوب، نقترح دمج إعادة صياغة استعلام المحادثة مباشرة في نموذج استرجاع كثيف. للمساعدة في هذا الهدف، نقوم بإنشاء مجموعة بيانات مع ملصقات ذات صلة زائفة للبحث عن المحادثة للتغلب على عدم وجود بيانات تدريب واستكشاف استراتيجيات تدريب مختلفة. نوضح أن نموذجنا يعيد كتابة استعلامات المحادثة بشكل فعال كتمثيلات كثيفة في البحث عن المحادثة والفتح عن نطاق البيانات. أخيرا، بعد مراعاة أن طرازنا يتعلم ضبط نموذج L2 من Arquer Token Ageddings، فإننا نستفيد من هذه الخاصية لاسترجاع الهجين ودعم تحليل الأخطاء.
Requery Rewrite (QR) هو مكون ناشئ في أنظمة المحادثة AI، مما يقلل من عيب المستخدم.سبب عيب المستخدم لأسباب مختلفة، مثل الأخطاء في نظام الحوار المنطوق أو عروض المستخدمين للسان أو لغتهم المختصرة.ينبع العديد من عيوب المستخدمين من العوامل الشخصية، مثل نمط خطاب المستخدم أو اللهجة أو التفضيلات.في هذا العمل، نقترح إطار عمل QR القائم على البحث شخصي، والذي يركز على التخفيض التلقائي لعيب المستخدم.نقوم ببناء مؤشر شخصي لكل مستخدم، يشمل طبقات تقارب متنوعة لتعكس التفضيلات الشخصية لكل مستخدم في منظمة العفو الدولية المحادثة.يحتوي نظام QR الشخصي الخاص بنا على طبقات استرجاع وترتيب.بدعم من التعلم القائم على ملاحظات المستخدم، تدريب نماذجنا لا يتطلب بيانات مشروح يدوية.أظهرت التجارب على مجموعة الاختبارات الشخصية أن نظام QR الشخصي الخاص بنا قادر على تصحيح أخطاء النظامية والمستخدم باستخدام المدخلات الصوتية والدلية.
في تطوير نظام لإجواب الأسئلة عبر الإنترنت للنطاقات الطبية، تلعب نماذج الاستدلال باللغة الطبيعية (NLI) دورا رئيسيا في مطابقة الأسئلة والكشف عن النية.ومع ذلك، ما هي النماذج هي الأفضل لمجموعات البيانات لدينا؟اختيار أو ضبط نموذج يدويا هو تستغرق وقتا طويل ا.وبالتالي، نقوم بتجربة تحسين هياكل النموذج تلقائيا على المهمة في متناول اليد عبر بحث العمارة العصبية (NAS).أولا، نقوم بصياغة مساحة بحث عن الهندسة المعمارية الجديدة تعتمد على أدب NAS السابق، ودعم النمذجة الانتباه عبر الجملة (Cross-Attn).ثانيا، نقترح تعديل طريقة ENAS لتسريع وتحقيق الاستقرار في نتائج البحث.نقوم بإجراء تجارب واسعة النطاق على مهامنا NLI الطبية.تظهر النتائج أن نظامنا يمكن أن يتفوق بسهولة على نماذج الأساس الكلاسيكية.نقارن أساليب NAS المختلفة وإظهار نهجنا يوفر أفضل النتائج.
العروض التقديمية مهمة للتواصل في جميع مجالات حياتنا، ومع ذلك فإن إنشاء الطوابق الشريحة غالبا ما تكون مملة وتستهلك الوقت.كان هناك بحث محدود يهدف إلى أتمتة عملية توليد المستندات إلى الشرائح وجميع مواجهة التحدي الحرج: لا توجد مجموعة بيانات متاحة للجمهور للتدريب والمعايير.في هذا العمل، فإننا نساهم أولا في مجموعة بيانات جديدة، Sciduet، تتكون من أزواج من الأوراق وحوابق الشرائح المقابلة من مؤتمرات NLP و ML الأخيرة (E.G.، ACL).ثانيا، نقدم D2S، وهو نظام جديد يتناول مهمة المستندات إلى الشرائح مع نهج من خطوتين: 1) استخدم عناوين الشريحة لاسترداد النص والأرقام والجشطة ذات الصلة والجاذبية؛2) لخص السياق المسترجع في نقاط رصاصة مع الإجابة على سؤال طويل الشكل.يشير تقييمنا إلى أن ضميز ضمنيا طويل النموذج يتفوق على خطوط الأساس الملخص لحدي الفن على كل من مقاييس الحمر التلقائي والتقييم البشري النوعي.
مشكلة استرجاع المستندات المستندة إلى المستندات المستندة إلى تضمينها هي موضوع ساخن في مجال استرجاع المعلومات (IR).بالنظر إلى أن نماذج اللغة المدربة مسبقا مثل بيرت حققت نجاحا كبيرا في مجموعة واسعة من مهام NLP، فإننا نقدم نموذجا رباعية لاسترجاع فعال وفع ال في هذه الورقة.على عكس معظم طرازات استرجاع أسلوب بيرت الموجود، والتي تركز فقط على مرحلة الترتيب في أنظمة الاسترجاع، فإن نموذجنا يجعل تحسينات كبيرة في مرحلة الاسترجاع وتزود المسافات بين الحالات السلبية السلبية والسلبية البسيطة للحصول على تضمين أفضل.توضح النتائج التجريبية أن لدينا QuadrouPletbert تحقق نتائج أحدث النتائج في مهام الاسترجاع على نطاق واسع القائم.
مع النمو المتسارع لحجم البيانات المخزنة في الأنظمة السحابية تصبح الحاجة إلى المعالجة الفعالة للبيانات أمراً حرجاً و ملحاً. يقدم هذا البحث دراسة أهم خصائص نظم إدارة قواعد البيانات الآتية: Hive و SQLMR و MariaDB Galera. إن Hive هو نظام إدارة قواعد بيان ات سحابي. و SQLMR هو نظام هجين يعتمد على الدمج بين قدرات النظم السحابية و التقليدية. أما Galera MariaDB فهو من نظم إدارة قواعد البيانات التقليدية المطورة لمواكبة الخصائص السحابية. تم في هذا البحث عرض أهم التطويرات التي تمت على تلك النظم و مقارنة أدائها في معالجة البيانات بالاعتماد على قياس زمن تنفيذ عمليات استعلام مع تغير حجم البيانات، و ذلك من أجل التعرف على أداء تلك الأنظمة عملياً و معرفة متطلبات تطويرها للوصول إلى نظام إدارة بيانات أمثلي، و لمساعدة المستخدمين في اختيار نظام قواعد البيانات الذي يحقق متطلباتهم من ناحية التوافرية و التدرجية.
يقترح البحث نظاماً جديداً يهدف إلى تخفيض زمن البحث عن ملفات الصور images عن طريق اقتراح آلية فهرسة جديدة تعالج العيوب التي عانت منها خوارزميات الفهرسة المستخدمة بحيث يصبح زمن الوصول لهذه الملفات أقل ما يمكن. تم بدايةً في هذه الورقة توضيح أهمية الأر شفة Archiving في تنظيم الملفات عن طريق تصميم قاعدة بيانات Database و تخزين ملفات الصور فيها و تسجيل الأزمنة اللازمة للحصول على الملفات المطلوبة من قاعدة البيانات, بعد ذلك تم إجراء عملية الفهرسة Indexing لملفات الصور المخزنة في قاعدة البيانات عن طريق اقتراح خوارزمية جديدة - B+ Tree المحسنة - تهدف إلى تنظيم ملفات الصور وفق آلية معينة تسهل الوصول للملفات المطلوبة و تم إجراء عمليات الاستعلام queries و تسجيل الأزمنة المستغرقة من أجل مقارنتها مع الأزمنة اللازمة للوصول إلى الملفات قبل الفهرسة بهدف إظهار كفاءة الطريقة المقترحة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا