ترغب بنشر مسار تعليمي؟ اضغط هنا

Muver: تحسين استرجاع كيان المرحلة الأولى بتمثيلات الكيانات المتعددة

MuVER: Improving First-Stage Entity Retrieval with Multi-View Entity Representations

284   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعد استرجاع الكيانات، الذي يهدف إلى إشراف الإزهام إلى الكيانات الكنسية من KBS ضخمة، ضروريا للعديد من المهام في معالجة اللغة الطبيعية.يوضح التقدم المحرز الأخير في استرجاع الكيانات أن هيكل التشفير المزدوج هو إطار قوي وفعال لترشيح المرشحين إذا تم تحديد الكيانات إلا بواسطة الأوصاف.ومع ذلك، فإنهم يتجاهلون العقار الذي يذكرنى أن معاني الكيان تذكر في سياقات مختلفة وترتبط بأجزاء مختلفة من الأوصاف، والتي تعامل على قدم المساواة في الأعمال السابقة.في هذا العمل، نقترح تمثيل كيان متعدد النقود (MURES)، وهو نهج رواية لاسترجاع الكيان الذي يبني تمثيلات متعددة المشاهدات لأوصاف الكيان وتقريب الرأي الأمثل للإشراف عبر طريقة البحث المثيرة.تحقق طريقةنا الأداء الحديثة على Zeshel ويحسن جودة المرشحين في مجموعات بيانات ربط كيان قياسية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تستخدم الرسوم البيانية المعرفة (KGS) على نطاق واسع لتخزين المعلومات والوصول إليها حول الكيانات وعلاقاتها.بالنظر إلى استفسار، تهدف مهمة استرجاع الكيانات من KG إلى تقديم قائمة في المرتبة ذات الصلة بالاستعلام.في الآونة الأخيرة، أظهر عدد متزايد من النماذ ج لاسترجاع الكيان تحسنا كبيرا على الأساليب التقليدية.هذه النماذج، ومع ذلك، تم تطويرها للكلية الإنجليزية.في هذا العمل، نبني على نظام واحد من هذا القبيل، يدعى Kewer، لاقتراح Serag (استرجاع الكيانات الدلالي من الرسوم البيانية المعرفة العربية).مثل Kewer، يستخدم Serag مناحي عشوائي لتوليد embeddings للكياء.تعتبر DBPedia-Entity V2 مجموعة الاختبار القياسية لاسترجاع الكيان.نناقش تحديات استخدامها للغات غير الإنجليزية بشكل عام والعربية على وجه الخصوص.نحن نقدم نسخة عربية من هذه المجموعة القياسية، واستخدامها لتقييم Serag.يظهر Serag أنه يتفوق بشكل كبير على نموذج BM25 الشهير بفضل التفكير المتعدد القفز.
على الرغم من النجاح الواسع النطاق للتعلم الإشراف على الذات من خلال نماذج لغة ملثم (MLM)، فإن التقاط علاقات الدلالية الدقيقة الدقيقة في المجال الطبي الحيوي يظل تحديا. هذا أمر بالغ الأهمية لمهام مستوى الكيان مثل الكيان الذي يربط حيث القدرة على نموذج ال علاقات الكيانية (خاصة المرادف) محورية. لمعالجة هذا التحدي، نقترح Sapbert، وهو مخطط الاحتجاط بأنه يتماشى على مساحة التمثيل من الكيانات الطبية الحيوية. نقوم بتصميم إطار تعلم متري قابل للتطوير الذي يمكنه الاستفادة من UMLs، وهي مجموعة هائلة من الأنتولوج الطبي الطبيعي مع مفاهيم 4M +. على النقيض من ذلك مع أنظمة Hybrid التي تعتمد على الأنابيب السابقة، تقدم Sapbert حلا أنيقا نموذجيا لمشكلة ربط الكيان الطبي (MEL)، وتحقيق حالة جديدة من بين الفن (SOTA) على ستة MEL Benchmark مجموعات البيانات. في المجال العلمي، نحقق سوتا حتى بدون إشراف خاص بمهام المهام. مع تحسن كبير على مختلف MLMS المحدد مسبقا للمجال مثل BioBert و SciberTand و PubMedbert، يثبت نظامنا المحدد فعال وقوي.
عملية التحقق من المطالبة تحديا لأنها تتطلب أولا العثور على أدلة نصية ثم قم بتطبيق تستيط أدلة المطالبة للتحقق من مطالبة.تقوم Works السابقة بتقييم خطوة الاستقبال استنادا إلى الأدلة المستردة، في حين أننا نفترض أن التنبؤ الاستيباري يمكن أن يوفر إشارات مف يدة لاسترجاع الأدلة، بمعنى أنه إذا كانت الجملة تدعم مطالبة أو يجب أن تكون الجملة ذات صلة.نقترح نموذج جديد يستخدم النتيجة الاستقبال للتعبير عن الملاءمة.تجاربنا تحقق من أن الاستفادة من التنبؤ التنفيذ يحسن الترتيب قطع متعددة من الأدلة.
التحقق من الحقائق الآلية على نطاق واسع هو مهمة صعبة لم تتم دراستها بشكل منهجي حتى وقت قريب.مجموعات وثيقة صاخبة كبيرة مثل الويب أو المقالات الإخبارية تجعل المهمة أكثر صعوبة.نحن تصف نظام فحص الحقائق الآلي من ثلاث مراحل، اسمه Quin +، باستخدام أساليب است رجاع الأدلة والاختيار.نحن نوضح أن استخدام تمثيلات مرور كثيفة يؤدي إلى أدلة أعلى بكثير استدعاء في بيئة صاخبة.نقترح أيضا أساليب اختيار الجملة، وهي اختيار مقرها التضمين باستخدام نموذج استرجاع كثيف، ونهج وضع العلامات المتسلسل لتحديد السياق.QUIN + قادر على التحقق من مطالبات المجال المفتوح باستخدام النتائج من محركات البحث على الويب.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا