ترغب بنشر مسار تعليمي؟ اضغط هنا

شرح حالة الكيان التلقائي باستخدام المحلل الدلالي Verbnet

Automatic Entity State Annotation using the VerbNet Semantic Parser

469   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعد دول كيان تتبع مهمة معالجة لغات طبيعية تفترض أن تتطلب شرحا بشريا. من أجل تقليل الوقت والنفقات المرتبطة بالتعليق التوضيحي، نقدم طريقة جديدة لاستخراج حالات الكيان تلقائيا، بما في ذلك الموقع والوجود حالة الكيانات، بعد Dalvi et al. (2018) وتاندون وآخرون. (2020). لهذا الغرض، نعتمد في المقام الأول على التمثيل الدلالي الناتج عن حالة محلل الحرف الحرفي الفن (Gung، 2020)، واستخراج الكيانات (مشاركين الأحداث) ودولهم، بناء على المسندات الدلالية للتمثيل الدليلي الذي تم إنشاؤه، وهو في تنسيق المنطق المقترح. للتقييم، استخدمنا Propara (Dalvi et al.، 2018)، وهي مجموعة بيانات لفهم القراءة التي يتم تفاحها مع الدول الكيانية في كل جملة، وتتبع تلك الدول في فقرات النصوص الإجرائية ذات التأليف البشري الطبيعي. بالنظر إلى القيود المقدمة من الطريقة، فإن خصائص شروح DataSet Propara، وأن نظامنا، Lexis، لا تستخدم بيانات التدريب الخاصة بمهام المهام وتعتمد فقط على Verbnet، والنتائج واعدة، وعرض قيمة الموارد المعجمية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

على الرغم من التطورات الحديثة في الدور الدوالي الذي يدفعه ترميز النص المدرب مسبقا مثل بيرت، فإن الأداء يتخلف عند تطبيقه على المسندات لاحظ بشكل غير منتظم أثناء التدريب أو إلى الجمل في مجالات جديدة. في هذا العمل، يمكننا التحقيق في كيفية تحسين أداء وضع العلامات على الدوران المنخفض التردد والبيانات خارج نطاق البيانات باستخدام Verbnet، معجم فعل يضم الأفعال إلى فئات هرمية تستند إلى سلوك النحوية والدلية المشتركة وتحدد التمثيل الدلالي وصف العلاقات بين الحجج. نجد أن فئات Verbnet توفر مستوى فعال من التجريد، وتحسين التعميم على المساكن المنخفض التردد من خلال السماح لهم بالتعلم من الأمثلة التدريبية للندوات الأخرى المنتمدة إلى نفس الفصل. نجد أيضا أن التدريب المشترك لعلامات الدور الحرفية والأزهار المسند للفئات الحرفية للأفعال البسيطة يؤدي إلى تحسينات في كلا المهام، مما يدعم بشكل طبيعي استخراج التمثيلات الدلالية في فيربيت.
في هذه الورقة، نقدم نتائج تجاربنا المتعلقة بالأداء الصفر - اللغات اللغات في المحلل الدلالي لحكم Perin إلى الرسم البياني. طبقنا طراز PTG المدربين باستخدام محلل Perin على جريدة 740k-Token Czech إلى الهنغارية. قمنا بتقييم أداء المحلل المحلل باستخدام أدا ة التقييم الرسمية للمهمة المشتركة MRP 2020. تم إنشاء الشروح الهنغارية القياسية الذهبية عن طريق التصحيح اليدوي لإخراج المحلل في أعقاب دليل الشرح للمستوى Tectogrammatical من TreeBank TreeBank براغ. ومع ذلك، فإن نموذج إنجليزي مدرب على كوربس صحيفة إنجليزية أكبر مليونا متاحا، وجدنا أن النموذج التشيكي أدى بشكل كبير على المدخلات الهنغارية بسبب حقيقة أن الهنغاري يشبه بشكل أكثر تشبه التشيكية من الإنجليزية. لقد وجدنا أن التحويل الصفرية لقطة بمعنى PTG يعنى تمثيل عبر اللغات غير البعيدة النموذجية باستخدام نموذج محلل عصبي يعتمد على نموذج لغة سياسي متعدد اللغات يتبعه تصحيح يدوي من قبل خبراء اللغاتين هو سيناريو قابل للتطبيق.
يمكن أن تلعب الموارد الحسابية مثل سورانيا المشروح الدولى دورا مهما في تمكين المتحدثين لغات الأقليات الأصلية للمشاركة في الحكومة والتعليم ومجالات الحياة العامة في لغتهم العامة.ومع ذلك، فإن العديد من اللغات - بشكل رئيسي أولئك الذين لديهم سكان متكلمون أ صليين صغار ودون تقاليد مكتوبة - ليس لديهم دعما رقميا.عقبة واحدة في إنشاء هذه الموارد هي أنه بالنسبة للعديد من اللغات، سيكون عدد قليل من المتحدثين قادرين على تسجيل النصوص - وهي مهمة تتطلب محو الأمية وبعض التدريب اللغوي - وأن وقت هؤلاء الخبراء عادة ما يكون في ارتفاع الطلب على أعمال تخطيط اللغة.تقوم هذه الورقة بتقييم ما إذا كانت غير مكبرات الصوت المدربة في لغة أصلية يمكن أن تؤدي إشعالا دلاليين باستخدام عروض توضيحي موحدة، مما يسمح بإنشاء مواد حسابية دون إيصال المزيد من الضغط على موارد المجتمع.
في الأعوام السابقة ظهر ويب جديد يعمل على التوازي مع الويب التقليدي، هو ويب البيانات المترابطة، و يكمن جوهره في تقديم البيانات بصيغة قابلة للفهم من قبل الآلة. و ذلك من خلال وصف هذه البيانات باستخدام مجموعة من المفردات تدعى انطولوجيا الويب، و في هذا ال وقت الذي أصبحت فيه الأدوات و المعايير المتعلقة بالويب الدلالي أكثر شمولا و استقرارا، مازال موضوع نشر بيانات الجامعة على شكل بيانات مترابطة يواجه مجموعة من التحديات أهمها عدم وجود أنطولوجيا موحدة و مقبولة بشكل كامل يمكن استخدامها في توصيف بيانات الجامعة. و من هنا يهدف هذا البحث إلى إيجاد أنطولوجيا ويب تحدد المفاهيم و المفردات التي تمكننا من توصيف البيانات في مجال الجامعة، بالتالي يكون بالإمكان مكاملة هذه البيانات مع بيانات من جامعات أخرى و إجراء الاستعلامات عليها. و من هنا يهدف هذا البحث إلى إيجاد أنطولوجيا الويب التي يمكن استخدامها لتوصيف البيانات في مجال الجامعة، بالتالي يكون ممكنا مكاملة هذه البيانات مع بيانات من جامعات أخرى و إجراء الاستعلامات عليها. و تم ذلك عن طريق إعادة استخدام معاجم منشورة على الويب و إضافة بعض الأصناف و الخصائص إليها، و تم تنظيم هذه الأنطولوجيا و مفرداتها باستخدام أداة بروتيجه Protégé
في حين أن نماذج قوية مدربة مسبقا قد تحسنت بطلاقة نماذج توليد النص، فإن كفاية الدلالة - القدرة على توليد نص مخلص من الدلالة إلى الإدخال - لا تزال قضية ملحوظة. في هذه الورقة، نقدم كفايات دهالية التقييم التلقائية الجديدة، والتي يمكن استخدامها لتقييم نما ذج توليد المدى التي تنفذ الرسوم البيانية التي لفظها RDF (إطار وصف الموارد) نص يحتوي على تذرف من الكيانات التي تحدث في RDF إدخال. هذا مهم مثل رودس موضوع وكيانات الكائنات التي تشكل 2/3 من المدخلات. نحن نستخدم المقياس الخاص بنا بمقارنة 25 نماذج من المهام المشتركة Webnlg وندرش الارتباط بنتائج التقييمات البشرية للكفايات الدلالية. نظرا لأنه بينما يرتبط متري لدينا مع درجات التقييم البشري، يختلف هذا الارتباط مع تفاصيل إعداد التقييم البشري. هذا يشير إلى أنه من أجل قياس كفاية الكيان التي تتخذ من النصوص التي تم إنشاؤها، قد يكون متريا أوتوماتيا مثل المرء المقترح هنا أكثر موثوقية، حيث كان أقل عرضية وأكثر ركزا على اللفظ الصحيح للمدخلات، من تدابير التقييم البشرية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا