ترغب بنشر مسار تعليمي؟ اضغط هنا

تعلم الهياكل التركيبية لتحليل الرسم البياني الدلالي

Learning compositional structures for semantic graph parsing

256   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

AM تحليل التبعية هي طريقة لتحليل الرسم البياني الدلالي العصبي الذي يستغل مبدأ التركيبية.على الرغم من أن محلل التبعية، فقد تبين أن محلل التبعية سريعة ودقيقة عبر العديد من الرسوم البيانية، فإنها تتطلب عبائيات صريحة لهياكل الأشجار التركيبية للتدريب.في الماضي، تم الحصول على هؤلاء استخدام الاستدلال المعقدة من الرسوم المشتركة من قبل الخبراء.هنا نظهر كيف يمكن تدريبهم بدلا من ذلك مباشرة على الرسوم البيانية مع نموذج متغير كامنة عصبي، مما يقلل بشكل كبير من كمية وتعقيد الاستدلال اليدوي.نوضح أن نموذجنا يلتقط العديد من الظواهر اللغوية بمفرده وتحقق دقة مماثلة للتدريب الخاضع للإشراف، مما يسهل بشكل كبير استخدام تحليل التبعية لشبانس جديدة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

النموذج المهيمن للتحلل الدلالي في السنوات الأخيرة هو صياغة تحليل كمركز تسلسل إلى تسلسل، وتوليد تنبؤات مع فك تراجع التسلسل التلقائي.في هذا العمل، نستكشف نموذجا بديلا.نقوم بصياغة تحليل دلالي كهامة تحليل التبعية، وتطبيق تقنيات فك التشفير المستندة إلى ال رسم البياني المتقدمة لتحليل النحوي.نحن نقارن مختلف تقنيات فك التشفير بالنظر إلى نفس التشفير المحول المدرب مسبقا في أفضل مجموعة البيانات، بما في ذلك الإعدادات التي تكون فيها بيانات التدريب محدودة أو تحتوي على أمثلة مشروح جزئيا فقط.نجد أن نهجنا القائم على الرسم البياني لدينا هو تنافسي مع فك ترميز الترميز على الإعداد المعياري، ويقدم تحسينات كبيرة في كفاءة البيانات والإعدادات حيث تتوفر البيانات المشروح جزئيا.
اكتسبت توليف البيانات لتحليل الدلالي اهتماما متزايدا مؤخرا. ومع ذلك، فإن معظم الطرق تتطلب قواعد يدوية (عالية الدقة) في عملية توليدها، مما يعوق استكشاف بيانات غير مرئية متنوعة. في هذا العمل، نقترح نموذجا عاما يتميز ببرنامج PCFG (غير العصبي) نماذج تكوي ن البرامج (E.G.، SQL)، ونموذج الترجمة المستندة إلى BART خرائط برنامج إلى كلام. نظرا لبساطة PCFG و BART المدربة مسبقا، يمكن تعلم نموذجنا التوليدي بكفاءة من البيانات الموجودة في متناول اليد. علاوة على ذلك، يؤدي التركيبات النمذجة بشكل صريح باستخدام PCFG إلى استكشاف أفضل لبرامج غير مرئية، وبالتالي توليد بيانات أكثر تنوعا. نقوم بتقييم طريقتنا في كل من الإعدادات داخل المجال والخروج من تحليل النص إلى SQL على المعايير القياسية للجهازية والعنكب العنكبوت، على التوالي. تبين نتائجنا التجريبية أن البيانات المركبة التي تم إنشاؤها من طرازنا يمكن أن تساعد بشكل كبير في محلل الدلالي يحقق تعميم أفضل أو مجال.
يعد تحليل الإطار الدلالي مهمة تحليل دلالية تعتمد على Framenet التي تلقت اهتماما كبيرا مؤخرا.تتضمن المهمة عادة ثلاث مجموعات فرعية بالتتابع: (1) التعرف المستهدف، (2) تصنيف الإطار و (3) وصف الدور الدليمي.ترتبط المهارات الفرعية الثلاثة ارتباطا وثيقا أثنا ء وجود دراسات سابقة طرازها بشكل فردي، مما يتجاهل اتصالاتهم المتدربين، وفي الوقت نفسه يحث مشكلة نشر الأخطاء.في هذا العمل، نقترح نموذج عصبي نهاية إلى نهائي لمعالجة المهمة بشكل مشترك.بشكل ملموس، استغلنا طريقة قائمة على الرسم البياني، فيما يتعلق بتحليل الإطار الدلالي كمشكلة بناء الرسم البياني.يتم التعامل مع جميع المسندات والأدوار كجزء رسم بياني، ويتم أخذ علاقاتهم كحواف رسم بياني.نتائج التجربة على مجموعة بيانات قياسية من الإطار الدلالي تظهر أن طريقتنا تنافسية للغاية، مما يؤدي إلى أداء أفضل من نماذج خطوط الأنابيب.
تهدف التحليل الدلالي القائم على الرسم البياني إلى تمثيل معنى نصي من خلال الرسوم البيانية الموجهة. باعتبارها واحدة من أكثر تمثيلات المعنى الواعدة في مجال الأغراض العامة، اكتسبت هذه الهياكل وتحليلها زخما فائدة كبير خلال السنوات الأخيرة، مع اقتراح عدة ش كليات متنوعة. ومع ذلك، بسبب هذا التجانس للغاية، ركز معظم الجهود البحثية بشكل أساسي على الحلول الخاصة بإشعاج معين. في هذا العمل، بدلا من ذلك، نقوم بإعادة صياغة التحليل الدلالي نحو شكليات متعددة لأن الترجمة الآلية العصبية متعددة اللغات (MNMT)، واقتراح SGL، وهي عبارة عن هندسة SCL، وهي عبارة عن مورد SEQ2SEQ متعدد الاستخدامات تدربت بهدف MNMT. مدعومة بالعديد من التجارب، نظير على أن هذا الإطار فعال بالفعل بمجرد تعزيز إجراءات التعلم مع شركة فورانيا المتوازية الكبيرة القادمة من الترجمة الآلية: نحن نبلغ عن عروض تنافسية على تحليل AMR و UCCA، خاصة بمجرد إقرانها مع الهندسة المعمارية المدربة مسبقا. علاوة على ذلك، نجد أن النماذج المدربة تحت مقياس التكوين جيدا بشكل ملحوظ إلى مهام مثل تحليل AMR عبر اللغات: تفوق SGL على جميع منافسها الهامش الكبير دون رؤية أمثلة غير الإنجليزية غير الإنجليزية في وقت التدريب في وقت التدريب، وبمجرد هذه الأمثلة يتم تضمين أيضا، يحدد حالة غير مسبوقة من الفن في هذه المهمة. نطلق سردنا ونماذجنا لأغراض البحث في https://github.com/sapienzanlp/sgl.
نحن نصف خسارة اهتمام مدفوع المستوى الذي يحسن التعميم التركيبي في المحللين الدلاليين.يعتمد نهجنا على الخسائر القائمة التي تشجع على خرائط الاهتمام في نماذج التسلسل العصبي إلى التسلسل لتقليد إخراج خوارزميات محاذاة الكلمة الكلاسيكية.حيث استخدم العمل السا بق محاذاة على مستوى الكلمات، ونحن نركز على يمتد؛اقتراض الأفكار من الترجمة الآلية القائمة على العبارة، نحن محاذاة السكتة الدلالية في تبييل الدلالي إلى امتداد جمل المدخلات، وتشجيع آليات الاهتمام العصبي لتقليد هذه المحاذاة.تعمل هذه الطريقة على تحسين أداء المحولات، RNNs، والكفران الهيكلية على ثلاثة معايير للتعميم التركيبي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا