ترغب بنشر مسار تعليمي؟ اضغط هنا

تحليل Euclidean مقابل تأطير الرسم البياني المستندة إلى الرسم البياني لتحرير المعجم الثنائي اللغة من مساحات تضمين كلمة

An Analysis of Euclidean vs. Graph-Based Framing for Bilingual Lexicon Induction from Word Embedding Spaces

322   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

العديد من الأعمال الحديثة في إظهار كلمة التحليل المعجمي ثنائي اللغة (BLI) Word Adgetdings كمنتجات في الفضاء Euclidean.على هذا النحو، يتم حلها عادة من خلال العثور على تحول خطي يقوم بخرائط Ageddings إلى مساحة مشتركة.بدلا من ذلك، قد تكون مفهومة Word Ageddings كما العقد في رسم بياني مرجح.هذا الإطار يتيح لنا فحص حي الرسم البياني للعقدة دون تولي التحول الخطي، ويستغل التقنيات الجديدة من أدب الأمثل في مطابقة الرسم البياني.لم تتم مقارنة هذه الأساليب المتناقضة في Bli حتى الآن.في هذا العمل، ندرس سلوك الأساليب Euclidean مقابل الأساليب القائمة القائم على الرسم البياني إلى Bli تحت شروط البيانات المختلفة وإظهار أنها تكمل بعضها البعض عند الجمع.نطلق سردنا في https://github.com/kellymarchisio/euc-v-graph-bli.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تحتاج الجيل القادم من أنظمة المحادثة AI إلى: (1) لغة العملية تدريجيا، يجب أن تكون الرمز المميز أكثر استجابة وتمكين التعامل مع ظواض المحادثة مثل توقف مؤقت وإعادة التشغيل والتصحيحات الذاتية؛ (2) السبب السماح بشكل تدريجي بالمعنى الذي سيتم إنشاؤه بعد ما يقال؛ (3) أن تكون شفافة ويمكن التحكم فيها، مما يسمح للمصممين وكذلك النظام نفسه بوضع أسباب بسهولة لسلوك معين والخياط لمجموعات مستخدمين معينة، أو المجالات. في هذه الورقة القصيرة، نقدم العمل الأولي المستمر يجمع بين بناء الجملة الديناميكي (DS) - إطار Grammar التدريجي والدلي - مع إطار وصف الموارد (RDF). هذا يمهد الطريق لإنشاء المحللين الدلاليين التدريجيين الذين ينتجون تدريجيا الرسوم البيانية الدلالية RDF كصحة تتكشف في الوقت الفعلي. نحن أيضا الخطوط العريضة كيف يمكن دمج المحلل المحلل بمحرك التفكير تدريجي من خلال RDF. نقول أن DS-RDF Hybrid يرضي Desiderata المذكورة أعلاه، مما أسفر عن البنية التحتية الدلالية التي يمكن استخدامها لبناء مستجيب، في الوقت الفعلي، AI محادثة محادثة مفسورة يمكن تخصيصها بسرعة لتوفير مجموعات مستخدمين محددة مثل الأشخاص المصابين بالخرف.
يمكن أن تخفف المعلومات الدقيقة من حدود الكلمات مشكلة الغموض المعجمي لتحسين أداء مهام معالجة اللغة الطبيعية (NLP). وبالتالي، فإن تجزئة الكلمات الصينية (CWS) مهمة أساسية في NLP. نظرا لتطوير نماذج اللغة المدربة مسبقا (PLM)، فإن المعرفة المدربة مسبقا يمك ن أن تساعد الأساليب العصبية في حل المشكلات الرئيسية ل CWS في إجراء كبير. حققت الطرق الحالية بالفعل أداء عال في العديد من المعايير (على سبيل المثال، bakeoff-2005). ومع ذلك، فإن الدراسات البارزة الحديثة محدودة من قبل كوربوس المشروح على نطاق صغير. لزيادة تحسين أداء أساليب CWS بناء على ضبط PLMS، نقترح إطار عمل عصبي رواية، LBGCN، الذي يشتمل على شبكة اتصالية قائمة بذاتها في الترميز في ترميز المحولات. النتائج التجريبية على خمسة معايير وأربعة مجموعات بيانات عبر المجال تظهر أن شبكة اتصال الرسوم البيانية المستندة إلى المعجم تستغرق بنجاح معلومات الكلمات المرشحة وتساعد على تحسين الأداء على المعايير (BakeOFF-2005 و CTB6) ومجموعات البيانات عبر المجال (Sighan- 2010). توضح المزيد من التجارب والتحليلات أن إطار عملنا المقترح نماذج المعجم بفعالية لتعزيز قدرة الأطر العصبية الأساسية وتعزز المتانة في سيناريو المجال العابر.
تهدف إلى توليد معجم البذور للاستخدام في مهام اللغة الطبيعية المصب والأساليب غير الخاضعة للرقابة لتحريض المعجم الثنائي اللغة قد حصلت على الكثير من الاهتمام في الأدبيات الأكاديمية مؤخرا. في حين أن الإعدادات المثيرة للاهتمام وغير المدمرة بالكامل غير واق عية؛ عادة ما تكون كميات صغيرة من البيانات ثنائية اللغة متاحة عادة بسبب وجود كوربوريل متوازي متعدد اللغات بشكل كبير، يمكن أن يخلق اللغويين كميات صغيرة من البيانات الموازية. في هذا العمل، نوضح نهجا فعالا من Bootstrapping لتعريفات المعجم الثنائية الشرفية شبه الإشراف التي تتمتع بنقاط القوة التكميلية لطريقين متباينين ​​لتحقيق المعجم الثنائي اللغة. في حين أن الطرق الإحصائية فعالة للغاية في حث أزواج الترجمة الصحيحة للكلمات التي تحدث في كثير من الأحيان في كوربوس موازية ومساحات تضمين أحادية مونولينغ لديها ميزة تم تدريبها على كميات كبيرة من البيانات، وبالتالي قد تحفز ترجمات دقيقة للكلمات غائبة عن الكائنات الصغيرة. من خلال الجمع بين هذه القوة النسبية وطريقتنا تحقق نتائج أحدث من الفن في 3 من 4 أزواج لغة في مجموعة اختبار VECMAP الصعبة التي تستخدم الحد الأدنى من الكميات من البيانات الموازية ودون الحاجة إلى قاموس الترجمة. نطلق تنفيذنا على www.blind-review.code.
قدم النيكل و Kiela (2017) طريقة جديدة لتضمين عقد الأشجار في كرة الخشب، وتشير إلى أن هذه المدينات القطعي هي أكثر فعالية بكثير من Auclidean Admings في الرسوم البيانية الكبيرة الهيكلية بشكل كبير، مثل WordNet Nouns Trees Hypernymy Tree.هذا صحيح بشكل خاص في الأبعاد المنخفضة (النيكل وجيلا، 2017، الجدول 1).في هذا العمل، نسعى لإعادة إنتاج تجاربهم على تضمين وإعادة بناء الرسوم البيانية Hypernymy Nouns.عداد إلى ما تقاريره، نجد أن Auclidean Abbeddings قادرة على تمثيل هذه الشجرة على الأقل بالإضافة إلى تضمين المخيفات، عندما سمحت ب 50 أبعاد على الأقل.نلاحظ أن هذا لا يقلل من أهمية عملهم بالنظر إلى الأداء المثير للإعجاب من التضامن القطعي في إعدادات منخفضة الأبعاد للغاية.ومع ذلك، بالنظر إلى التأثير الواسع لعملهم، فإن هدفنا هنا هو تقديم مقارنة محدثة وأكثر دقة بين Euclidean و SuperBolic Elegbeddings.
تهدف مهمة التحقق من الحقائق القائمة على الطاولة إلى التحقق مما إذا كان البيان المحدد مدعوم من الجدول شبه المنظم المحدد. يلعب المنطق الرمزي مع العمليات المنطقية دورا حاسما في هذه المهمة. الأساليب الحالية الاستفادة من البرامج التي تحتوي على معلومات منط قية غنية لتعزيز عملية التحقق. ومع ذلك، نظرا لعدم وجود إشارات خاضعة للإشراف بالكامل في عملية توليد البرنامج، يمكن استخلاص البرامج الزائفة وعملها، مما يؤدي إلى عدم قدرة النموذج على العمليات المنطقية المفيدة. لمعالجة المشكلات المذكورة أعلاه، في هذا العمل، نقوم بصياغة مهمة التحقق من الحقائق القائمة على الطاولة كإطار لاسترجاع الأدلة والتفكير، حيث اقترح شبكة التحقق من الأدلة على مستوى المنطق وشبكة التحقق القائمة على الرسم البياني (LERGV). على وجه التحديد، نقوم أولا باسترجئة الأدلة التي تشبه البرامج على مستوى المنطق من الجدول المعطى والبيان كدليل تكميلي على الطاولة. بعد ذلك، نقوم بإنشاء رسم بياني لمستوى منطقي لالتقاط العلاقات المنطقية بين الكيانات والوظائف في الأدلة المستردة، وتصميم شبكة التحقق القائمة على الرسم البياني لإجراء المنطق المستندة إلى الرسم البياني على مستوى المنطق بناء على الرسم البياني الذي تم إنشاؤه لتصنيف النهائي علاقة استقامة. النتائج التجريبية على Tabract Tabract القياسي على نطاق واسع تظهر فعالية النهج المقترح.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا