ترغب بنشر مسار تعليمي؟ اضغط هنا

استخراج، دمج، تنافس: نحو مفهوم قراءة نمط التحقق

Extract, Integrate, Compete: Towards Verification Style Reading Comprehension

248   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقدم مجموعة بيانات مفهوم التحقق من قراءة جديدة تسمى vgaokao من اختبارات اللغة الصينية في Gaokao.تختلف عن الجهود الحالية، تم تصميم مجموعة البيانات الجديدة في الأصل لتقييم المتحدثين الأصليين، وبالتالي تتطلب مهارات تفاهم لغة أكثر تقدما.لمعالجة التحديات في Vgaokao، نقترح نهجا جديدا متناكج للمتخصص، الذي يختار تكرارا دليلا تكميليا مع وجود آلية تحديث استعلام رواية وأدلة تدعم تكاليف، تليها مسابقة زوجية لدفع النماذج لتعلم الفرق الدقيق بين ما شابه ذلكقطع النص.تبين التجارب أن أساليبنا تتفوق على مختلف خطوط الأساس على Vgaokao مع أدلة تكميلية مستردة، مع وجود مزايا الكفاءة والشرطية.يتم إصدار DataSet و Code لدينا لمزيد من البحث.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن استخراج وسيطة الحدث الضمني (EAE) هي مهمة حاسمة لاستخراج المعلومات على مستوى المستندات تهدف إلى تحديد حجج الحدث بما يتجاوز مستوى الجملة.على الرغم من الجهود العديدة لهذه المهمة، فإن عدم وجود بيانات تدريبية كافية قد أعاقت الدراسة.في هذه الورقة، نأخذ منظورا جديدا لمعالجة قضية Sparsity الخاصة بالبيانات التي تواجهها EAE الضمنية، من خلال سد المهمة مع فهم القراءة بالآلة (MRC).على وجه الخصوص، نحن ابتكرت نظاميين تكبير البيانات عبر MRC، بما في ذلك: 1) يتيح نقل المعرفة الضمني، مما يتيح نقل المعرفة من المهام الأخرى، من خلال بناء إطار تدريب موحد في صياغة MRC، و 2) تكبير بيانات صريح، والتي يمكن أن تولد جديدا جديداأمثلة تدريبية، عن طريق علاج نماذج MRC كهندان.لقد بررت التجارب الواسعة فعالية نهجنا - - لا يحصل فقط على أداء حديثة على معيارين، ولكن أيضا يوضح نتائج متفوقة في سيناريو منخفضة البيانات.
حققت النماذج المدربة مسبقا للمحولات، مثل بيرت، نتائج رائعة بشأن فهم القراءة في الآلة. ومع ذلك، نظرا لقيود طول الترميز (E.G.، 512 Tokenspece)، عادة ما يتم تقسيم وثيقة طويلة إلى قطع متعددة يتم قراءتها بشكل مستقل. ينتج عن أن حقل القراءة يقتصر على القطع الفردية دون تعاون المعلومات لفهم قراءة آلات المستندات الطويلة. لمعالجة هذه المشكلة، نقترح ROR، وهي طريقة للقراءة للقراءة، والتي تقوم بتوسيع حقل القراءة من قطعة إلى المستند. على وجه التحديد، يتضمن ROR قارئ قطعة وقارئ مستند. السابق يتوقع أولا مجموعة من الإجابات الإقليمية لكل قطعة، والتي يتم ضغطها بعد ذلك في إصدارا كبيرا مكثفا من المستند الأصلي، مما يضمن ترميزه مرة واحدة. يتنبأ الأخير كذلك بالإجابات العالمية من هذه الوثيقة المكثفة. في النهاية، يتم استخدام استراتيجية التصويت إلى إجمالي الإجابات الإقليمية والعالمية للتنبؤ النهائي. تثبت تجارب واسعة على معيارين Quac و Triviaqa فعالية ROR للحصول على قراءة المستندات الطويلة. والجدير بالذكر أن ROR يحتل المرتبة الأولى على المتصدرين Quac (https://quac.ai/) في وقت التقديم (17 مايو، 2021).
تقدم هذه الورقة المهمة المشتركة Semeval-2021 4: قراءة الفهم من معنى مجردة (Recam). تم تصميم هذه المهمة المشتركة للمساعدة في تقييم قدرة الآلات في تمثيل وفهم مفهوم مجردة. يتعين على النظام المقابل، من المتوقع أن يختار نظام المشاركة، الإجابة الصحيحة من خ مسة مرشحين من المفاهيم المجردة في الفهم مهام. بناء على اثنين من التعريفات النموذجية للمخراج، أي غير محسنة وغير محددة، توفر مهمتنا ثلاثة مجموعات فرعية لتقييم قدرة النماذج في فهم النوعين من المعنى التجريدي وتعميم النماذج. على وجه التحديد، يهدف فرقة فرعية 1 إلى تقييم مفاهيم نماذج النظام المشاركة التي لا يمكن أن ينظر إليها مباشرة في العالم المادي. يركز SubTask 2 على قدرة النماذج في فهم مفاهيم غير محددة تقع عالية في التسلسل الهرمي Hypernym نظرا لسياق مرور. يهدف SubTask 3 إلى توفير بعض الأفكار حول تعميم النماذج على النوعين من الممرضين. خلال فترة التقييم الرسمية SEMEVAL-2021، تلقينا 23 تقريرا إلى الفرعية 1 و 28 إلى الفريق الفرعي 2. قدمت الفرق المشاركة بالإضافة إلى ذلك 29 تقريرا إلى الفرع الفرعي 3. يمكن العثور على موقع المتصدرين ومواقع المنافسة في HTTPS: //competitions.codalab. ORG / المسابقات / 26153. تتوفر بيانات البيانات وخطوط الأساس في https://github.com/boyuanzheng010/semeval2021-Reading-comprehension-of-Abstract-meaning.
نقترح طريقة بسيطة لتوليد سؤال متعدد اللغات والإجابة على أزواج على نطاق واسع من خلال استخدام نموذج عام واحد.يمكن استخدام هذه العينات الاصطناعية لتحسين الأداء الصفر لقطة من نماذج QA متعددة اللغات على اللغات المستهدفة.يتطلب تدريبنا المتعدد المهام المقتر ح للنموذج الإداري فقط عينات التدريب المسمى باللغة الإنجليزية، مما يؤدي إلى إزالة الحاجة إلى مثل هذه العينات باللغات المستهدفة، مما يجعلها تنطبق على لغات أخرى بكثير من تلك التي تحتوي على البيانات المسمى.تشير التقييمات البشرية إلى أن غالبية مثل هذه العينات صحيحة وناصمة.تظهر النتائج التجريبية أن نهجنا المقترح يمكن أن يحقق مكاسب كبيرة في DataSet Xquad، مما يقلل من الفجوة بين الصفر بالرصاص والأداء الخاضع للإشراف على نماذج QA أصغر بلغات مختلفة.
يصف هذا العمل تكيف نموذج تسلسل متطلب مسبقا بمهمة التحقق من المطالبة العلمية في المجال الطبي الطبيعي.نقترح نظام يسمى Vert5erini الذي يستغل T5 لاسترجاع الملخص واختيار الجملة وتنبؤ التسمية، وهي ثلاثة مهام فرعية حرجة للتحقق من الادعاء.نقوم بتقييم خط أناب يبنا في SCIFACT، وهي مجموعة بيانات مفيدة حديثا تتطلب نماذج لا تتوقع فقط عن صحة المطالبات ولكنها توفر أيضا جمل ذات صلة من كائن من الأدبيات العلمية التي تدعم التنبؤ.تجريبيا، يتفوق نظامنا على خط أساس قوي في كل من المهام الفرعية الثلاث.نعرض أيضا قدرة Vert5erini على التعميم لمجموعات بيانات جديدة من مطالبات CovID-19 باستخدام أدلة من Cord-19 Corpus.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا