ترغب بنشر مسار تعليمي؟ اضغط هنا

جمع البيانات مقابل معرفة الرسم البياني المعرفة: ما هو مطلوب لتحسين التغطية؟

Data Collection vs. Knowledge Graph Completion: What is Needed to Improve Coverage?

378   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تناقش ورقة الاستقصاء / المركبة هذه الطرق لتحسين تغطية الموارد مثل WordNet.RAPP تقدر الارتباطات، RHO، بين إحصائيات كوربوس ومعايير الهاجولية.RHO يحسن مع الكمية (حجم كوربوس) والجودة (التوازن).1M الكلمات تكفي لتقديرات بسيطة (ترددات غير منغرام)، ولكن 100x على الأقل مطلوب لتقديرات جيدة للجمعيات والمواد المدمجة.نظرا مثل هذه التقديرات، فإن تغطية Wordnet رائعة.تم تطوير WordNET في SEMCOR، عينة صغيرة (كلمات 200K) من كوربوس البني.محاولات إكمال الرسم البياني المعرفي (KGC) تعلم الروابط المفقودة من مجموعات فرعية من مجموعات فرعية.لكن تقديرات Rapp للأحجام تشير إلى أنها ستكون أكثر ربحية لجمع المزيد من البيانات من استنتاج المعلومات المفقودة التي ليست موجودة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الملخص لتطوير تطبيقات NLP المتطرفة المنطقية، وهو رسم بياني معرفي شامل ودقيق للعموم (CKG).إنها تستغرق وقتا طويلا لإنشاء CKGS يدويا والعديد من جهود البحثية التي تم تخصيصها للبناء التلقائي CKGS.تركز النهج السابقة على توليد المفاهيم التي لديها علاقات مبا شرة واضحة مع المفاهيم القائمة وتفتقر إلى القدرة على توليد مفاهيم غير واضحة.في هذا العمل، نهدف إلى سد هذه الفجوة.نقترح الإطار العام لإحاطاء بيئة الرسم البياني إلى مسارات يرفع هياكل مرتفعة في CKGS لالتقاط علاقات عالية الجودة بين المفاهيم.نحن إنشاء هذا الإطار العام إلى أربع حالات خاصة: المسار الطويل، المسار إلى المسار، جهاز التوجيه، ورأس الرسم البياني - مسار العقدة.تجارب على مجموعة بيانات اثنين تثبت فعالية أساليبنا.سيتم إصدار الرمز عبر مستودع GitHub العام.
حققت الرسم البياني المعرفي، الذي يمثل الكيانات والعلاقات في الرسوم البيانية المعرفة مع ناقلات عالية الأبعاد، تقدما كبيرا في التنبؤ بالربط. استكشف المزيد من الباحثين القدرات التمثيلية للنماذج في السنوات الأخيرة. وهذا هو، يحققون في نماذج تمثيلية أفضل ل تناسب التناظر / مضادات التنسيق والعلاقات الجمع. تعد نماذج التضمين الحالية أكثر ميلا لاستخدام ناقل متطابق لنفس الكيان في ثلاثة أضعاف لقياس الأداء المطابق. إن الملاحظة التي تقيس عقلانية ثلاثية محددة تعني مقارنة درجة المطابقة من السمات المحددة المرتبطة بالعلاقات معروفة جيدا. مستوحاة من هذه الحقيقة، تقوم هذه الورقة بتصميم المرشح الدلالي بناء على العلاقات (SFBR) لاستخراج الصفات المطلوبة للكيانات. ثم يتم مقارنة عقلانية ثلاثية تحت هذه السمات المستخرجة من خلال نماذج التضمين التقليدية. يمكن إضافة وحدة تصفية الدلالية إلى معظم نماذج التحلل الهندسية والشعور مع الحد الأدنى من الذاكرة الإضافية. تبين التجارب في مجموعات البيانات القياسية أن المرشح الدلالي القائم على العلاقات يمكن أن تقمع تأثير أبعاد السمات الأخرى وتحسين أداء تنبؤ الارتباط. حققت نماذج التحلل مع SFBR أحدث من الفن.
أظهرت السنوات الأخيرة تطورات سريعة في مجال تعلم الجهاز متعدد الوسائط، والجمع بين الأمراء على سبيل المثال، الرؤية والنصوص أو الكلام.في هذه الورقة الموضع، نوضح كيف يستخدم الحقل التعريفات القديمة متعددة الوسائط التي تثبت عصر التعلم الآلي.نقترح تعريف مهم ة جديدة للعمليات النسبية (متعددة) في سياق تعلم الآلة متعددة الوسائط التي تركز على التمثيلات والمعلومات ذات الصلة بمهمة تعليمية آلات معينة.من خلال تعريفنا الجديد لعدة التعددية، نهدف إلى تقديم مؤسسة مفقودة لأبحاث متعددة الوسائط، وهو عنصر مهم من التأريض اللغوي ومعالم حاسمة تجاه NLU.
تعكس العلاقات في معظم الرسوم البيانية المعارف التقليدية (KGS) فقط الاتصالات الثابتة والواقعية، ولكنها تفشل في تمثيل الأنشطة الديناميكية وتغير الدولة حول الكيانات. في هذه الورقة، نؤكد على أهمية دمج الأحداث في تعلم تمثيل KG، واقتراح نموذج Eventke Event ke Eventke المحسن للحدث. على وجه التحديد، نظرا لل KG الأصلية، فإننا ندمج أول عقود حدث من خلال بناء شبكة غير متجانسة، حيث يتم توزيع العقد الكيانية وعقد الحدث على جانبي الشبكة بين روابط الوسيطة في الحدث. ثم نستخدم علاقات كيان الكيان من الروابط الزمنية KG والأحداث الزمنية الأصلية إلى الكيان والكيان الداخلي والوقت على التوالي. نقوم بتصميم طريقة تمرير رسائل مفيدة وتستند إلى الرواية، والتي يتم إجراؤها على كيان كيان وكيان الحدث وحدث الأحداث لفيد معلومات الحدث في AGBeddings KG. تظهر النتائج التجريبية على مجموعات البيانات في العالم الحقيقي أن الأحداث يمكن أن تحسن إلى حد كبير جودة AGEDDINGS KG على مهام متعددة المصب.
تم اقتراح نماذج إتمام المعرفة الزمنية المختلفة (KG) في الأدب الحديث. تحتوي النماذج عادة على جزأين، وهي طبقة تضمين زمنية ووظيفة نتيجة مشتقة من نهج النمذجة الثابتة الحالية. نظرا لأن النهج تختلف عدة أبعاد، بما في ذلك وظائف النتيجة المختلفة واستراتيجيات التدريب، فإن المساهمات الفردية في تقنيات التضمين الزمنية المختلفة لنموذج الأداء ليست واضحة دائما. في هذا العمل، ندرس بشكل منهجي ستة مناهج تضمين الزمنية وقياس أدائها تجريبيا عبر مجموعة واسعة من التكوينات مع حوالي 3000 تجربة و 13159 ساعة GPU. نقوم بتصنيف الأشرطة الزمنية إلى فئتين: (1) embeddings timestamp و (2) تضمين كيان تعتمد على الوقت. على الرغم من الاعتقاد المشترك بأن الأخير أكثر تعبيرية، تظهر دراسة تجريبية واسعة النطاق أن تضمين الطابع الزمني يمكن أن تحقق أداء على قدم المساواة أو أفضل مع المعلمات أقل بكثير. علاوة على ذلك، نجد أنه عند التدريب بشكل مناسب، غالبا ما تتقلص فروق الأداء النسبية بين مختلف الأشرطة الزمنية وأحيانا حتى عكسها عند مقارنتها بالنتائج السابقة. على سبيل المثال، يمكن أن تتفوق TTRANSE (CIRING)، واحدة من نماذج KG الزمنية الأولى، الفضلات الأخرى في مجال بيانات ICEWS. لتعزيز المزيد من الأبحاث، نحن نقدم أول إطار موحد مفتوح المصدر لنماذج إكمال KG الزمنية مع توصيف كامل، حيث يمكن الجمع بين المدينين الزمني ووظائف النتيجة ووظائف الخسائر والدعوانات والنمذجة الصريحة للعلاقات المتبادلة بشكل تعسفي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا