ترغب بنشر مسار تعليمي؟ اضغط هنا

التقاط الهيكل المنطقي للوثائق المنظمة بصريا مع محلل انتقال متعدد الوسائط

Capturing Logical Structure of Visually Structured Documents with Multimodal Transition Parser

305   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في حين أن العديد من خطوط أنابيب NLP تفترض أن النصوص النظيفة النظيفة، فإن العديد من النصوص التي نواجهها في البرية، بما في ذلك الغالبية العظمى من المستندات القانونية، ليست نظيفة للغاية، حيث يجري العديد منهم وثائق منظم بصريا (VSDS) مثل PDF. تقوم الأدوات المعالجة التقليدية ل VSDS تركز بشكل أساسي على تجزئة الكلمات وتحليل التخطيط الخشن، في حين أن تحليل الهيكل المنطقي المحلقات الدقيقة (مثل تحديد حدود الفقرة وهرميها) من VSDS هي غير متكسدة. تحقيقا لهذه الغاية، اقترحنا صياغة المهمة كتنبؤ بملميات الانتقال "بين شظايا الرسائل النصية التي تعرض الشظايا إلى شجرة، وتطوير نظام لتعلم الماكينات المستندة إلى ميزة يمبرص إشارات مرئية ونصية ودلية. يتم تخصيص نظامنا بسهولة إلى أنواع مختلفة من VSDS وكانت خطوط الأساس بشكل كبير في تحديد الهياكل المختلفة في VSDS. على سبيل المثال، حصل نظامنا على درجة الكشف عن حدود الفقرة 0.953 أفضل بكثير من أداة PDF-To-to-todly ذات درجة كبيرة مع درجة F1 من 0.739.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

منطق episodic: نموذج منطقي غير مشدود '' (el-elf) هو تمثيل دلالي يلتقط بنية حجة المسنون وكذلك جوانب أكثر تحديا للغة داخل الشكليات المنطقية الباردة.نقدم النهج المستفاد الأول لأول مرة لتحليل الجمل إلى ULFS، باستخدام مجموعة متزايدة من الأمثلة المشروحة.تو فر النتائج خط أساس قوي للتحسين في المستقبل.تتعلم طريقتنا نموذج تسلسل إلى تسلسل للتنبؤ بتسلسل إجراء الانتقال داخل نظام انتقال ذاكرة التخزين المؤقت المعدلة.نقوم بتقييم فعالية القيود القائمة على القواعد، معجم من كلمة إلى رمز، وميزات ولاية نظام الانتقال في هذه المهمة.نظامنا متاح في https://github.com/genelkim/ulf-transition-parser.ونحن نقدم أيضا بيانات Oulf Oullf الرسمية الأولى في HTTPS://www.cs.rochester.edu/u/gkim21/ulf/resources/.
تقدم هذه الورقة مجموعة بيانات جديدة للفيديو واللغة مع إجراءات بشرية للاستدلال المنطقي متعدد الوسائط، والتي تركز على التعبيرات المتعمدة وجوقية تصف الإجراءات البشرية الديناميكية.تتكون DataSet من 200 فيديو، 5554 ملصقات عمل، و 1،942 ثلاثة توائم عمل من ال نموذج (الموضوع، المسند، كائن) يمكن ترجمته بسهولة إلى تمثيلات دلالية منطقية.من المتوقع أن تكون DataSet مفيدة لتقييم أنظمة الاستدلال متعددة الوسائط بين مقاطع الفيديو والجمل المعقدة الدلوية بما في ذلك النفي والكمية.
تعد بيانات المعرفة هائلة وواسعة الانتشار في العالم الحقيقي، والتي يمكن أن تكون بمثابة مصادر خارجية جيدة لإثراء المحادثات. ومع ذلك، في محادثات المعرفة، لا تزال النماذج الحالية تفتقر إلى السيطرة الجميلة على اختيار المعرفة والتكامل مع الحوارات، والتي تؤ دي أخيرا إلى مشاكل توليد الاستجابة غير ذات الصلة المعرفة: 1) اختيار المعرفة يعتمد فقط على سياق الحوار، وتجاهل انتقالات المعرفة المتأصلة جنبا إلى جنب مع تدفقات المحادثة؛ 2) غالبا ما تناسب النماذج أثناء التدريب، مما يؤدي إلى استجابة غير متماسكة من خلال الإشارة إلى الرموز غير المرتبطة من محتوى المعرفة المحددة في مرحلة الاختبار؛ 3) على الرغم من أن الاستجابة يتم إنشاؤها على تاريخ الحوار والمعرفة، إلا أن النماذج غالبا ما تميل إلى التغاضي عن المعرفة المحددة، وبالتالي يولد استجابة المعرفة غير ذات الصلة. لمعالجة هذه المشكلات، اقترحنا نموذجي صراحة انتقال المعرفة في محادثات متعددة الدورانية المتسلسلة عن طريق تجريد المعرفة إلى علامات موضوعية. بالإضافة إلى ذلك، لاستخدام المعرفة المختارة بالكامل في عملية التوليد، نقترح ما قبل التدريب مولد الاستجابة على علم المعرفة لدفع المزيد من الاهتمام على المعرفة المحددة. على وجه الخصوص، يقوم نموذج انتقال المعرفة المتسلسل المزود بمولد استجابة مدروس مدرسي مسبقا (SKT-KG) بتصوير انتقال المعرفة الرفيع المستوى ويستخدم بالكامل بيانات المعرفة المحدودة. تشير النتائج التجريبية على كل من معايير الحوار المنظم وغير المنظمة إلى المعرفة المعرفة إلى أن نموذجنا يحقق أداء أفضل على النماذج الأساسية.
نقدم انبعاثات: منصة لالتقاط التفاعلات متعددة الوسائط كتسجيلات تجارب عرضية مع تفسيرات مرجعية واضحة والتي تسفر عن رسم بياني للمعرفة العرضي (EKG). تقوم المنصة بتخزين تدفقات طرائق متعددة كإشارات متوازية. يتم تجزئة كل إشارة ومشروحة بشكل مستقل مع التفسير. يتم تعيين التعليقات التوضيحية في نهاية المطاف للهيوانات الصريحة والعلاقات في EKG. وبينما نحن شرائح إشارة الأرض من طرائق مختلفة إلى نفس تمثيلات الحالة، فإننا نرتفي أيضا طرائق مختلفة في بعضها البعض. فريد من نوعه ل EKG لدينا هو أنه يقبل تفسيرات مختلفة عبر الطرائق والمصادر والخبرات ودعم المنطق بشأن المعلومات المتعارضة وعدم اليقين التي قد تنجم عن تجارب متعددة الوسائط. يمكن أن يسجل EMISSOR والتعليق التجارب في العالم الافتراضي والعال الحقيقي، والجمع بين البيانات، وتقييم سلوك النظام وأدائها لتحقيق الأهداف المحددة مسبقا ولكن أيضا نموذج تراكم المعرفة والتفسيرات في الرسم البياني المعرفي نتيجة لهذه التجارب الباقية.
نحن نبحث عن طرق لإنشاء مفاهيم معقدة في النصوص من تلك البدائية أثناء تأسيسها في الصور.نقترح الرسم البياني للمفهوم والعلاقة (CRG)، والتي تبني أعلى تحليل الدوائر الانتخابية وتتكون من مفاهيم مجتمعة متكررة مع وظائف المسند.وفي الوقت نفسه، نقترح كسبية مفهوم شبكة عصبية تسمى الملحن للاستفادة من CRG للتعلم المفهوم الأساس بصريا.على وجه التحديد، نتعلم تأريض كل من المفاهيم البدائية وجميع المفاهيم المكونة عن طريق محاذاةها إلى الصور وإظهار أن التعلم من تأليف يؤدي إلى نتائج أساسية أكثر قوة، مما يقاس بدقة مطابقة النص إلى الصورة.والجدير بالذكر أن نموذجنا يمكن أن ينشفي المفاهيم المتطرفة التي تشكل على مستوى الجملة الدقيقة على مستوى الجملة ومستوى الحمض المعترض (أو مستوى الكلمات).يؤدي الملحن إلى تحسين وضوحا في دقة مطابقة عندما تحتوي بيانات التقييم على تباين مركب كبير من بيانات التدريب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا