ترغب بنشر مسار تعليمي؟ اضغط هنا

نموذج استخراج ثلاثي ثلاثي الطاولة على أساس تعبئة الجدول

A Novel Global Feature-Oriented Relational Triple Extraction Model based on Table Filling

155   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعبئة الجدول تعبئة أساليب استخراج ثلاثية تستند إلى الحصول على اهتمامات بحثية متزايدة بسبب أدائها الواعد وقدراتها على استخراج ثلاث مرات من الجمل المعقدة. ومع ذلك، فإن هذا النوع من الطرق بعيدة عن إمكاناتهم الكاملة لأن معظمهم يركزون فقط على استخدام الميزات المحلية ولكنهم يتجاهلون الجمعيات العالمية للعلاقات وأزواج الرمز المميز، مما يزيد من إمكانية التغاضي عن بعض المعلومات المهمة أثناء الاستخراج الثلاثي. للتغلب على هذا النقص، نقترح نماذج استخراج ثلاثية عالمية موجهة نحو الميزات التي تجعل الاستخدام الكامل من النوعين المذكورين من الجمعيات العالمية. على وجه التحديد، نقوم أولا بتوليد ميزة جدول لكل علاقة. ثم يتم استخراج نوعين من الجمعيات العالمية من ميزات الجدول التي تم إنشاؤها. بعد ذلك، يتم دمج الجمعيات العالمية الملغومة في ميزة الجدول في كل علاقة. يتم تنفيذ عملية توليد من الألغام "" عدة مرات بحيث تكون ميزة الجدول في كل علاقة خطوة بخطوة. أخيرا، يتم ملء جدول كل علاقة بناء على ميزة جدولها المكرر، ويتم استخراج جميع ثلاث مرات المرتبطة بهذه العلاقة بناء على جدولها المليء. نقيم النموذج المقترح على ثلاث مجموعات بيانات معيار. تظهر النتائج التجريبية نموذجنا فعالا وتحقق نتائج أحدث النتائج على جميع مجموعات البيانات هذه. يتوفر رمز المصدر لعملنا على: https://github.com/neukg/grte.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توفر الجداول معرفة قيمة يمكن استخدامها للتحقق من العبارات النصية. في حين أن عددا من الأعمال قد نظر في التحقق من الحقائق القائم على الطاولة، فإن المحاذاة المباشرة للبيانات الجذابية مع الرموز في البيانات النصية نادرا ما توفرها. علاوة على ذلك، فإن تدريب نموذج التحقق من الحقائق المعممة يتطلب بيانات تدريبية ملصقة وفيرة. في هذه الورقة، نقترح نظام رواية لمعالجة هذه المشكلات. مستوحاة من السببية المتعددة، يحدد نظامنا من رجال الصمغ على مستوى الرمز في البيان مع تقدير البحار الذي يستند إلى التحقيق. يتيح تقدير Salience التعلم المعزز للتحقق من الحقائق من وجهات نظر. من منظور واحد، يقوم نظامنا بإجراء تنبؤ ممثن بالبرنامج المريح لتعزيز النموذج للمحاذاة والتفكير بين الطاولة والبيان. من المنظور الآخر، ينطبق نظامنا على توضيح تكبير البيانات الإدراك بالاستثناء لإنشاء مجموعة متنوعة من مثيلات التدريب عن طريق استبدال المصطلحات غير البارزة. تظهر النتائج التجريبية على Tabract التحسن الفعال من خلال تقنيات التعلم التي أدركها Carience المقترحة، مما يؤدي إلى أداء Sota الجديد على المعيار.
يحدد تلخيص الجدول الزمني الأحداث الرئيسية من مجموعة أخبار ويصفها بعد النظام الزمني، مع التواريخ الرئيسية الموسومة. الأساليب السابقة تولد عموما ملخصات بشكل منفصل لكل تاريخ بعد تحديد تواريخ الأحداث الرئيسية. تطل هذه الطرق على الأحداث "Intra-Interra -ys ures (الحجج) والهياكل المختلفة (اتصالات أحداث الأحداث). بعد مسار مختلف، نقترح تمثيل المقالات الإخبارية كشركة بيانية حدث، وبالتالي تصبح التلخيص ضغط الرسم البياني بأكمله إلى الرسم البياني الفرعي البارز. الفرضية الرئيسية هي أن الأحداث المتصلة بها من خلال الوسائط المشتركة والنظام الزمني تصور هيكل عظمي جدول زمني، يحتوي على أحداث ذات صلة من الناحية الدلوية، متماسكة مؤقتا ومربحا هيكليا في الرسم البياني العالمي للحدث. يتم بعد ذلك إدخال مسافة النقل الأمثل التي تدركها على تعلم نموذج الضغط بطريقة غير منشأة. نظرا لأن نهجنا يتحسن بشكل كبير على حالة الفن على ثلاث مجموعات بيانات حقيقية، بما في ذلك معايير قياسية عامة ومجموعة بيانات الطوارئ 10 المجمعة حديثا.
نقوم بإلقاء مجموعة من مهام استخراج المعلومات في إطار ترجمة نصية إلى ثلاثية. بدلا من حل كل مهمة تعتمد على مجموعات البيانات والنماذج الخاصة بالمهام، نقوم بإضفاء الطابع الرسمي على المهمة كترجمة بين نص الإدخال الخاص بمهارات المهام وتصل إلى ثلاث مرات. من خلال اتخاذ المدخلات الخاصة بالمهامة، فإننا تمكن الترجمة المرجعية على المهام من خلال الاستفادة من المعرفة الكامنة التي يحتوي عليها نموذج لغة مدرب مسبقا حول المهمة. نوضح كذلك أن مهمة ما قبل التدريب البسيطة المتمثلة في التنبؤ بالمعلومات العلاجية التي تتوافق مع نص الإدخال هو وسيلة فعالة لإنتاج مخرجات خاصة بالمهام. وهذا يتيح نقل الطلقة الصفرية لإطارنا إلى مهام المصب. ندرس أداء الطلقة الصفرية لهذا الإطار في استخراج المعلومات المفتوح (OIE2016، NYT، WEB، PENN)، تصنيف العلاقة (عدد قليل من الألوان والمستقبلية)، والتحقيق الواقعي (Google-Re و T-Rex). التحويلات النموذجية غير تيهية لمعظم المهام وغالبا ما تكون تنافسية مع طريقة تحت إشراف بالكامل دون الحاجة إلى أي تدريب خاص بمهام. على سبيل المثال، نتفوق بشكل كبير على درجة F1 من استخراج المعلومات المفتوح الخاضعة للإشراف دون الحاجة لاستخدام مجموعة التدريب الخاصة بها.
تم في هذا العمل اصطناع ثلاثة مركبات جديدة من مونوميرات البنزوكسازين انطلاقاً من مركبات (الفينول، الهيدروكينون، 2-نفتول) و مركب ثلاثي ايتوكسي سيليل بروبيل أمين (TESPA) و بارا الفورم الدهيد، حيث استخدم مركب (TESPA) لدراسة تأثيره على الثبات الحراري للبولي بنزوكسازينات الناتجة عن بلمرة المونوميرات المحضرة بفتح الحلقة.
حققت نماذج الإجابة على الجدول (TableQa) ضعيفا (TableQA) أداء حديثة من خلال استخدام محول بيرت المدرب مسبقا إلى ترميز سؤال وجداول لإنتاج استعلام منظم للسؤال. ومع ذلك، في الإعدادات العملية يتم نشر أنظمة Tableqa عبر جدول كوربورا وجود توزيعات موضوعية وتوز يعات كلمة متميزة تماما من Bertraining Corpus. في هذا العمل، نحاكي سيناريو التحول العملي من خلال تصميم معايير التحدي الجديدة Wikisql-TS و WiKiTe-TS، وتتألف من تقسيم اختبار قطار Dev في خمس مجموعات موضوع مميزة، استنادا إلى مجموعات بيانات Wikisql والأسئلة الشائعة. نوضح تجريبيا أنه على الرغم من التدريب المسبق على نص واسع النطاق، يتحلل أداء النماذج بشكل كبير عندما يتم تقييمها على مواضيع غير مرئية. ردا على ذلك، نقترح T3QA (موضوع الإجابة على الجدول القابل للتحويل) إطار التكيف العملي ل TableQA يتألف من: (1) حقن المفردات المحددة للموضوع في بيرت، (2) مولد محول نص إلى نص جديد (مثل T5، GPT2) يركز خط أنابيب توليد السؤال الطبيعي المستندة إلى اللغة الطبيعية على توليد بيانات التدريب الخاصة بالموضوع، و (3) Reveer نموذج منطقي. نظهر أن T3QA يوفر خط الأساس الجيد بشكل معقول لمعايير تحول الموضوع لدينا. نعتقد أن معاييرنا المنفصلة لدينا ستؤدي إلى حلول طاولة قوية مناسبة للنشر العملي

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا