ترغب بنشر مسار تعليمي؟ اضغط هنا

من المحاذاة إلى المهمة: محاذاة كيان بسيطة غير مؤسس بسيطة

From Alignment to Assignment: Frustratingly Simple Unsupervised Entity Alignment

191   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تهدف محاذاة الكيان المتبادل (EA) إلى إيجاد الكيانات المكافئة بين Crosslingual KGS (الرسوم البيانية المعرفة)، وهي خطوة حاسمة لإدماج KGS.في الآونة الأخيرة، يتم اقتراح العديد من طرق EA القائمة على GNN وإظهار تحسينات الأداء اللائق على العديد من مجموعات البيانات العامة.ومع ذلك، فإن طرق EA القائمة القائمة على GNN ترثت حتما بشكل حتمة الترجمة الشفوية والكفاءة المنخفضة من الشبكات العصبية.تحفزه افتراض ISOMORPHIC من الأساليب القائمة على GNN، ونحن نجح في تحويل مشكلة EA عبر اللغات في مشكلة مهمة.بناء على هذا التعريف، نقترح طريقة محاذاة كيان بسيطة ولكنها فعالة بشكل محبط (SEU) دون شبكات عصبية.أجريت تجارب واسعة لإظهار أن نهجنا المقترح غير المقترح حتى يدق طرق متقدمة تحت إشراف على جميع مجموعات البيانات العامة مع ارتفاع الكفاءة والتفسيرية والاستقرار.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

انفجرت الإجابة على الأسئلة المفتوحة في مجال الشعبية مؤخرا بسبب نجاح نماذج استرجاع كثيفة، والتي تجاوزت النماذج المتناقضة باستخدام بعض الأمثلة التدريبية الإشراف فقط. ومع ذلك، في هذه الورقة، نوضح النماذج الكثيفة الحالية ليست بعد الجراد المقدس من استرجاع ها. نقوم أولا بإنشاء المنفيات، وهي مجموعة من الأسئلة البسيطة والغنية للكيان بناء على حقائق من Wikidata (على سبيل المثال، أين ولد الفرح؟ نحن نبحث في هذه القضية والكشف عن أن المستردات الكثيفة لا يمكن أن تعمم فقط إلى الكيانات المشتركة ما لم يلاحظ أن نمط السؤال صراحة أثناء التدريب. نحرق اثنين من الحلول البسيطة نحو معالجة هذه المشكلة الحاسمة. أولا، نوضح أن تكبير البيانات غير قادر على إصلاح مشكلة التعميم. ثانيا، نجيد أن تشفير مرور أكثر قوة يساعد في تسهيل التكيف بشكل أفضل باستخدام تشفير الأسئلة المتخصصة. نأمل أن يتم إلقاء عملنا الضوء على التحديات في إنشاء مسترد كثيف قوي، يعمل بشكل جيد عبر توزيعات المدخلات المختلفة.
على الرغم من النجاح الواسع النطاق للتعلم الإشراف على الذات من خلال نماذج لغة ملثم (MLM)، فإن التقاط علاقات الدلالية الدقيقة الدقيقة في المجال الطبي الحيوي يظل تحديا. هذا أمر بالغ الأهمية لمهام مستوى الكيان مثل الكيان الذي يربط حيث القدرة على نموذج ال علاقات الكيانية (خاصة المرادف) محورية. لمعالجة هذا التحدي، نقترح Sapbert، وهو مخطط الاحتجاط بأنه يتماشى على مساحة التمثيل من الكيانات الطبية الحيوية. نقوم بتصميم إطار تعلم متري قابل للتطوير الذي يمكنه الاستفادة من UMLs، وهي مجموعة هائلة من الأنتولوج الطبي الطبيعي مع مفاهيم 4M +. على النقيض من ذلك مع أنظمة Hybrid التي تعتمد على الأنابيب السابقة، تقدم Sapbert حلا أنيقا نموذجيا لمشكلة ربط الكيان الطبي (MEL)، وتحقيق حالة جديدة من بين الفن (SOTA) على ستة MEL Benchmark مجموعات البيانات. في المجال العلمي، نحقق سوتا حتى بدون إشراف خاص بمهام المهام. مع تحسن كبير على مختلف MLMS المحدد مسبقا للمجال مثل BioBert و SciberTand و PubMedbert، يثبت نظامنا المحدد فعال وقوي.
تحليل التبعية عبر المجال غير الخاضع للإكمال هو إنجاز تكيف مجال تحليل التبعية دون استخدام البيانات المسمى في المجال المستهدف. غالبا ما تكون الأساليب الحالية من نوع التوضيح الزائفة، والتي تنشئ البيانات من خلال التوضيح الذاتي للنموذج الأساسي وأداء التدر يب التكراري. ومع ذلك، فشلت هذه الطرق في النظر في تغيير هيكل النموذج لتكييف المجال. بالإضافة إلى ذلك، لا يمكن استغلال المعلومات الهيكلية الواردة في النص بالكامل. لعلاج هذه العيوب، نقترح محلل التبعية التبعية للتكيف مع بنية دلالات (SSADP)، التي تنجز تحليلات التبعية عبر المجال غير الخاضعة للكشف دون الاعتماد على التوضيح الزائفة أو اختيار البيانات. على وجه الخصوص، نقوم بتصميم اثنين من النازعين ميزة لاستخراج الميزات الدلالية والهيكلية على التوالي. لكل نوع من الميزات، يتم استخدام طريقة تكيف الميزة المقابلة لتحقيق تكيف المجال لمواءمة توزيع المجال، والتي تعزز بشكل فعال إمكانية نقل المجال المتقاطع بشكل فعال للنموذج. نحن نقوم بالتحقق من فعالية طرازنا عن طريق إجراء تجارب على Codt1 و CTB9 على التوالي، وتظهر النتائج أن نموذجنا يمكن أن يحقق تحسين أداء ثابتا. علاوة على ذلك، نتحقق من قدرة نقل الهيكل النموذج المقترح عن طريق إدخال اختبار Weisfeiler-Lehman.
أدى توفر Corpora إلى تقدم كبير في تدريب المحللين الدلاليين باللغة الإنجليزية.لسوء الحظ، لغات أخرى غير اللغة الإنجليزية، البيانات المشروحة محدودة وكذلك أداء المحللين المتقدمة.لقد أثبتت نماذج متعددة اللغات مؤخرا مفيدة للتحويل الصفر اللغوي في العديد من مهام NLP.ماذا يحتاج إلى تطبيق محلل محلل مدرب باللغة الإنجليزية إلى لغات أخرى من التحليل الدلالي الصفر اللغوي؟هل ستساعد ميزات بسيطة من اللغة المستقلة؟تحقيقا لهذه الغاية، نقوم بتجربة ستة بنية تمثيل خطوبة (DRS) المحللين الدلاليين باللغة الإنجليزية، وتعميمهم إلى الإيطالية والألمانية والهولندية، حيث لا يوجد سوى عدد قليل من الحواجز المشروحة يدويا.تظهر تجارب مكثفة أنه على الرغم من بساطته، مضيفا علاقات التبعية العالمية (UD) وعلامات نقاط البيع العالمية (UPOS) حيث تحقق ميزات نموذجية للأذرع تحسن قوي بشكل مدهش على جميع المحللين.
تعاني نماذج الترجمة الآلية العصبية غير التلقائية (NART) من مشكلة الوسائط المتعددة والتي تسبب عدم تناسق الترجمة مثل تكرار الرمز المميز. حاولت معظم الأساليب الأخيرة حل هذه المشكلة من خلال النمذجة الضمنية التبعيات بين المخرجات. في هذه الورقة، نقدم Align art، الذي يرفع معلومات المحاذاة الكاملة إلى تقليل طريقة التوزيع المستهدف بشكل صريح. تقسم AlignArt مهمة ترجمة الآلة في (1) تقدير المحاذاة و (2) الترجمة مع مدخلات فك تشفير محاذاة، توجيه وحدة فك التركيز للتركيز على الترجمة المبسطة الواحدة المبسطة. لتخفيف مشكلة تقدير المحاذاة، فإننا نقترح كذلك طريقة تحلل المحاذاة الجديدة. تظهر تجاربنا أن Alignart تفوق النماذج السابقة غير التكرارية التي تركز على تخفيض طريقة صريحة على WMT14 EN↔DE و WMT16 RO → EN. علاوة على ذلك، تحقق Alignart درجات بلو مماثلة لتلك النماذج القائمة على التصنيف الزمني للدولة من الفنون على WMT14 En↔de. نلاحظ أيضا أن Alignart يعالج بشكل فعال مشكلة تكرار الرمز المميز حتى دون تقطير المعرفة على مستوى التسلسل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا