ترغب بنشر مسار تعليمي؟ اضغط هنا

Serag: استرجاع الكيانات الدلالية من الرسوم البيانية المعرفة العربية

SERAG: Semantic Entity Retrieval from Arabic Knowledge Graphs

369   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تستخدم الرسوم البيانية المعرفة (KGS) على نطاق واسع لتخزين المعلومات والوصول إليها حول الكيانات وعلاقاتها.بالنظر إلى استفسار، تهدف مهمة استرجاع الكيانات من KG إلى تقديم قائمة في المرتبة ذات الصلة بالاستعلام.في الآونة الأخيرة، أظهر عدد متزايد من النماذج لاسترجاع الكيان تحسنا كبيرا على الأساليب التقليدية.هذه النماذج، ومع ذلك، تم تطويرها للكلية الإنجليزية.في هذا العمل، نبني على نظام واحد من هذا القبيل، يدعى Kewer، لاقتراح Serag (استرجاع الكيانات الدلالي من الرسوم البيانية المعرفة العربية).مثل Kewer، يستخدم Serag مناحي عشوائي لتوليد embeddings للكياء.تعتبر DBPedia-Entity V2 مجموعة الاختبار القياسية لاسترجاع الكيان.نناقش تحديات استخدامها للغات غير الإنجليزية بشكل عام والعربية على وجه الخصوص.نحن نقدم نسخة عربية من هذه المجموعة القياسية، واستخدامها لتقييم Serag.يظهر Serag أنه يتفوق بشكل كبير على نموذج BM25 الشهير بفضل التفكير المتعدد القفز.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يتم إجراء جيل نصي من الرسوم البيانية الدلالية تقليديا مع الطرق الحتمية، والتي تولد وصفا فريدا نظرا رسم بياني للإدخال.ومع ذلك، تعترف مشكلة الجيل مجموعة من النواتج النصية المقبولة، وعرض الاختلاف المعجمي والمنظمات والدلية.لمعالجة هذا الفصل، نقدم مساهمتي ن رئيسيتين.أولا، نقترح نموذج رسم بياني مؤشر استوكاستكي، حيث يتضمن متغير كامنة في نموذج فك الترميز، واستخدامه في مجموعة.ثانيا، لتقييم تنوع الجمل التي تم إنشاؤها، نقترح مقياس التقييم التلقائي الجديد الذي يقيم بشكل مشترك تنوع المخرجات وجودة في إعداد متعدد المراجع.نقيم النماذج على مجموعات بيانات Webnlg باللغة الإنجليزية والروسية، وإظهار مجموعة من نماذج الاستوكاستك تنتج مجموعات متنوعة من الجمل التي تم إنشاؤها أثناء الاستفيؤ بجودة مماثلة لنماذج أحدث من النماذج.
يهدف كتابة كيان الرسم البياني للمعرفة إلى أن ينتج أنواع الكيانات المفقودة في الرسوم البيانية المعرفة التي تعد قضية مهمة ولكنها غير مستحقة.تقترح هذه الورقة طريقة رواية لهذه المهمة من خلال الاستفادة من المعلومات السياقية للكيانات.على وجه التحديد، نقوم بتصميم آليات الاستدلال: I) N2T: استخدام كل جار كل جار بشكل مستقل لاستنتاج نوعه؛2) AGG2T: إجمالي جيران كيان لاستنتاج نوعها.ستنتج هذه الآليات نتائج الاستدلال المتعددة، وتستخدم طريقة تجميع مضاعفة بشكل كبير لتوليد نتيجة الاستدلال النهائي.علاوة على ذلك، نقترح وظيفة خسارة جديدة لتخفيف المشكلة السلبية الخاطئة أثناء التدريب.تجارب على اثنين من كلغ العالم الحقيقي توضح فعالية طريقتنا.يمكن الحصول على شفرة المصدر وبيانات هذه الورقة من https://github.com/cciiplab/cet.
أصبحت الرسوم البيانية المعرفة (KGS) شعبية بشكل متزايد في السنوات الأخيرة. ومع ذلك، نظرا لأن المعرفة تنمو باستمرار وتغييرات، فمن المحتم أن تمتد KGS الموجودة مع الكيانات التي ظهرت أو أنها ذات صلة بنطاق كجم بعد إنشائها. تعتمد البحث في تحديث KGS عادة على استخراج الكيانات المسماة والعلاقات من النص. ومع ذلك، لا يمكن لهذه الأساليب استنتاج كيانات أو علاقات غير مذكورة صراحة. بدلا من ذلك، استغلال نماذج التضمين الانتظار الهيكلية الضمنية للتنبؤ بالعلاقات المفقودة، ولكن لا يمكن التنبؤ بالكيانات المفقودة. في هذه المقالة، نقدم طريقة جديدة لإثراء KG مع كيانات جديدة بالنظر إلى وصفها النصي. لدينا طريقة ترفع نماذج تضمين مشتركة، وبالتالي لا تتطلب كيانات أو علاقات يمكن تسميتها صراحة. نظرا لأن نهجنا يمكن أن تحدد مفاهيم جديدة في كوربوس وثيقة ونقلها إلى كجم، ونجد أن أداء طريقتنا يحسن بشكل كبير عند تمديده مع تقنيات من تعدين حكم الرابطة، والتعدين النصي، والتعلم النشط.
تصميم التمثيلات التعبيرية للكيانات والعلاقات في الرسم البياني المعرفي هو مسعى مهم. في حين أن العديد من الأساليب الحالية تركز بشكل أساسي على التعلم من الأنماط العلائقية والمعلومات الهيكلية، فقد تم تجاهل التعقيد الجوهري لكي كيانات KG أكثر أو أقل. بشكل أكثر ملاءمة، نفترض كيانات KG قد تكون أكثر تعقيدا مما نعتقد، أي، قد يرتدي الكيان العديد من القبعات والأحدث العلائقية قد تشكل بسبب أكثر من سبب واحد. تحقيقا لهذه الغاية، تقترح هذه الورقة التعلم من تمثيلات DESENTANGLED من كيانات كيغ كيغ - وهي طريقة جديدة تقوم بتخفيف الخصائص الكامنة الداخلية لكي كيانات كيغ كيانات. تعمل عملية DESTANGLED الخاصة بنا على مستوى الرسم البياني ويتم الاستفادة من آلية الحي لزيادة الخصائص المخفية لكل كيان. هذا النهج التعلم في التمثيل هذا هو نموذج غير مرجح ومتوافق مع نهج Enonical KG Adgedding. نقوم بإجراء تجارب مكثفة على العديد من مجموعات البيانات القياسية، تجهيز مجموعة متنوعة من النماذج (الإقصاء، بسيطة، والقلق) مع آلية DESTANGLING المقترحة. توضح النتائج التجريبية أن نهجنا المقترح يحسن الأداء بشكل كبير على المقاييس الرئيسية.
يُعتبر الويب الدلالي ثورة جديدة في عالم الويب، حيث تصبح المعلومات و البيانات قابلة للمعالجة منطقياً من قِبل برامج الحاسوب، بحيث تتحول تلك المعلومات و البيانات إلى شبكة معارف ذات معنى مُحدّد. يُشكّل الويب الدلالي مستقبل الويب الحالي مع الإشارة إلى أن البحوث و الدراسات العربية ما زالت قليلة نسبياً في هذا المجال. نعرض في هذه الورقة دراسة مرجعية عن الويب الدلالي و الطرق المختلفة لاستكشاف المعارف و استنباط المعلومات المفيدة من الكم الهائل من البيانات التي يوفرها الويب. كما نُقدّم مثال برمجي قمنا بتطويره كتطبيق لبعض التقانات التي يُقدمها الويب الدلالي و لاسيما طرق استكشاف المعارف فيه. نوفر في هذا المثال البرمجي المبسط بعض الخدمات المتعلقة بالتعليم العالي الحكومي السوري، مثل معلومات عن الجامعات الحكومية السورية كاسم الجامعة (الافتراضية، دمشق، تشرين، حلب و البعث)، موقع الجامعة، عنوان موقعها على شبكة الويب، عدد الطلاب فيها، و ملخص عن الجامعة، مما يُساعد العملاء الأذكياء على إيجاد تلك الخدمات ديناميكيا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا