ترغب بنشر مسار تعليمي؟ اضغط هنا

ROR: قراءة الزائدة للقراءة لآلة المستندات الطويلة

RoR: Read-over-Read for Long Document Machine Reading Comprehension

267   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

حققت النماذج المدربة مسبقا للمحولات، مثل بيرت، نتائج رائعة بشأن فهم القراءة في الآلة. ومع ذلك، نظرا لقيود طول الترميز (E.G.، 512 Tokenspece)، عادة ما يتم تقسيم وثيقة طويلة إلى قطع متعددة يتم قراءتها بشكل مستقل. ينتج عن أن حقل القراءة يقتصر على القطع الفردية دون تعاون المعلومات لفهم قراءة آلات المستندات الطويلة. لمعالجة هذه المشكلة، نقترح ROR، وهي طريقة للقراءة للقراءة، والتي تقوم بتوسيع حقل القراءة من قطعة إلى المستند. على وجه التحديد، يتضمن ROR قارئ قطعة وقارئ مستند. السابق يتوقع أولا مجموعة من الإجابات الإقليمية لكل قطعة، والتي يتم ضغطها بعد ذلك في إصدارا كبيرا مكثفا من المستند الأصلي، مما يضمن ترميزه مرة واحدة. يتنبأ الأخير كذلك بالإجابات العالمية من هذه الوثيقة المكثفة. في النهاية، يتم استخدام استراتيجية التصويت إلى إجمالي الإجابات الإقليمية والعالمية للتنبؤ النهائي. تثبت تجارب واسعة على معيارين Quac و Triviaqa فعالية ROR للحصول على قراءة المستندات الطويلة. والجدير بالذكر أن ROR يحتل المرتبة الأولى على المتصدرين Quac (https://quac.ai/) في وقت التقديم (17 مايو، 2021).



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لقد أثبتت تدريب الخصم (AT) كطريقة تنظيمي فعاليتها على المهام المختلفة.على الرغم من وجود تطبيقات ناجحة في بعض مهام NLP، إلا أن الخصائص المميزة لمهام NLP لم يتم استغلالها.في هذه الورقة، نهدف إلى تطبيق مهام فهم القراءة (MRC).علاوة على ذلك، فإننا نتكيف م ع مهام MRC من خلال اقتراح طريقة تدريبية عديدة جديدة تسمى PQAT التي تتعلق بمصفوفة التضمين بدلا من ناقلات Word.للتمييز بين أدوار الممرات والأسئلة، يستخدم PQAT مصفوفات إضافية P / Q Directding إضافية لجمع الاضطرابات العالمية للكلمات من الممرات والأسئلة بشكل منفصل.نحن نختبر الطريقة على مجموعة واسعة من مهام MRC، بما في ذلك RC الاستخراجية المستندة إلى RC واستخراج RC متعددة الخيارات.تظهر النتائج أن التدريب الخصم فعال عالميا، ويحسن PQAT الأداء.
آلة القراءة الفهم هي مهمة صعبة خاصة للاستعلام عن المستندات ذات السياقات العميقة والترابطية.أظهرت الطرق المستندة إلى المحولات عروضا متقدمة في هذه المهمة؛ومع ذلك، فإن معظمهم لا يزال يعاملون المستندات كمتسلسلة مسطحة من الرموز.يقترح هذا العمل طريقة جديدة قائمة على المحولات التي تقرأ مستند كشرائح شجرة.يحتوي على وحديتين لتحديد المزيد من مقاطع النص ذات الصلة وأفضل إجابة سبان على التوالي، والتي لا يتم تدريبها بشكل مشترك فقط ولكن أيضا تشاور بشكل مشترك في وقت الاستدلال.تظهر نتائج تقييمنا أن أسلوبنا المقترح تتفوق على العديد من النهج الأساسية التنافسية على مجموعة بيانات من مجالات متنوعة.
يقوم هذا البحث على تفكيك آلية مصطلح النسق المضمر، وذلك في تطبيقاته التحليلية على نسقي (الفحولة/ الأنوثة) في النقد الثقافي عند الغذامي؛ بغية الكشف عن إشكالات هذا المصطلح النقدية التي لم يتفطّن لها المهتمون بالنقد الثقافي عامة، أو بنقد نتاج الغذامي خاص ة. وهي إشكالات يمكن تصنيفها في ثلاثة أنواع. الأول إشكال التضاد/التناقض، وهو حينما يكون هناك نصّان للغذامي في موضوع واحد، ويكونان متضادين أو متناقضين، أي ينسخ أحدهما الآخر. وأمّا الإشكال الثاني فهو إشكال اللعب، وهو النص الذي يحمل قراءة أخرى تغاير قراءة الغذامي، يمكن للمتلقي أن يستظهرها بأدوات النقد الثقافي وآلياته ذاتها. والنوع الثالث إشكال الخطيئة، وهو النص الذي يحمل دلالة نقدية تخالف آلية النقد الثقافي وتلغيه.
إن استخراج وسيطة الحدث الضمني (EAE) هي مهمة حاسمة لاستخراج المعلومات على مستوى المستندات تهدف إلى تحديد حجج الحدث بما يتجاوز مستوى الجملة.على الرغم من الجهود العديدة لهذه المهمة، فإن عدم وجود بيانات تدريبية كافية قد أعاقت الدراسة.في هذه الورقة، نأخذ منظورا جديدا لمعالجة قضية Sparsity الخاصة بالبيانات التي تواجهها EAE الضمنية، من خلال سد المهمة مع فهم القراءة بالآلة (MRC).على وجه الخصوص، نحن ابتكرت نظاميين تكبير البيانات عبر MRC، بما في ذلك: 1) يتيح نقل المعرفة الضمني، مما يتيح نقل المعرفة من المهام الأخرى، من خلال بناء إطار تدريب موحد في صياغة MRC، و 2) تكبير بيانات صريح، والتي يمكن أن تولد جديدا جديداأمثلة تدريبية، عن طريق علاج نماذج MRC كهندان.لقد بررت التجارب الواسعة فعالية نهجنا - - لا يحصل فقط على أداء حديثة على معيارين، ولكن أيضا يوضح نتائج متفوقة في سيناريو منخفضة البيانات.
في هذه الورقة، نقدم مجموعة بيانات مفهوم التحقق من قراءة جديدة تسمى vgaokao من اختبارات اللغة الصينية في Gaokao.تختلف عن الجهود الحالية، تم تصميم مجموعة البيانات الجديدة في الأصل لتقييم المتحدثين الأصليين، وبالتالي تتطلب مهارات تفاهم لغة أكثر تقدما.لم عالجة التحديات في Vgaokao، نقترح نهجا جديدا متناكج للمتخصص، الذي يختار تكرارا دليلا تكميليا مع وجود آلية تحديث استعلام رواية وأدلة تدعم تكاليف، تليها مسابقة زوجية لدفع النماذج لتعلم الفرق الدقيق بين ما شابه ذلكقطع النص.تبين التجارب أن أساليبنا تتفوق على مختلف خطوط الأساس على Vgaokao مع أدلة تكميلية مستردة، مع وجود مزايا الكفاءة والشرطية.يتم إصدار DataSet و Code لدينا لمزيد من البحث.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا