الملخص بينما طردت نماذج اللغة المحددة (LMS) مكاسب مثيرة للإعجاب على المهام المورفو والدلية، وقدرتها على نموذج الخطاب والظواهر البراغماتية أقل وضوحا.كخطوة نحو فهم أفضل لقدرات النمذجة خطابها، نقترح مهمة كشف التسلل.ندرس أداء مجموعة واسعة من LMS المحدد مسبقا على مهمة الكشف هذه للغة الإنجليزية.تفتقر إلى مجموعة بيانات للمهمة، ونحن نقدم DataSet Inteded Inteded، وهي عبارة عن بيانات الكشف عن عقوبة الدخيل الرواية، والتي تحتوي على 170،000+ مستندات مصنوعة من مقالات أخبار Wikipedia و CNN الإنجليزية.تظهر تجاربنا أن LMS المسبدة مسبقا تؤدي بشكل مثير للإعجاب في التقييم داخل المجال، بل تواجه انخفاضا كبيرا في إعداد المجال المتبادل، مما يشير إلى قدرة تعميم محدودة.نتائج أخرى على مجموعة بيانات مسبار لغوية جديدة تظهر أن هناك مجالا كبيرا للتحسين، خاصة في إعداد المجال المتقاطع.
Abstract While pretrained language models (LMs) have driven impressive gains over morpho-syntactic and semantic tasks, their ability to model discourse and pragmatic phenomena is less clear. As a step towards a better understanding of their discourse modeling capabilities, we propose a sentence intrusion detection task. We examine the performance of a broad range of pretrained LMs on this detection task for English. Lacking a dataset for the task, we introduce INSteD, a novel intruder sentence detection dataset, containing 170,000+ documents constructed from English Wikipedia and CNN news articles. Our experiments show that pretrained LMs perform impressively in in-domain evaluation, but experience a substantial drop in the cross-domain setting, indicating limited generalization capacity. Further results over a novel linguistic probe dataset show that there is substantial room for improvement, especially in the cross- domain setting.
المراجع المستخدمة
https://aclanthology.org/
تهدف مهمة اكتشاف الحدث (ED) في استخراج المعلومات إلى الاعتراف وتصنيف كلمات الأحداث في النص. تميز التقدم الأخير نماذج لغوية متقدمة للمحولات المتقدمة (على سبيل المثال، بيرت) كعنصر حاسم في النماذج الحديثة للإد. ومع ذلك، فإن الحد الطول لنصوص الإدخال هو ح
من المعروف أن مهام توليد اللغة الطبيعية (NLG) على اللغات المؤيدة للإسقاط تعاني من مشاكل ضمير Zero (ZP)، وتظل المشكلات تحديا بسبب ندرة NLG Corpora المشروح من ZP.في هذه الحالة، نقترح نهجا للغاية على مرحلتين على مرحلتين للغاية على نمذجة السياق الزوجي مع
تعتمد مطورو نماذج جيل النص على مقاييس التقييم الآلي كمستقلة للتقييمات اليدوية البطيئة والمكلفة. ومع ذلك، كافحت مقاييس تقسيم الصور لإعطاء تقديرات مستفادة دقيقة للنجاح الدلالي والبراغماتي لنص الإخراج. نحن نتطلع إلى هذا الضعف عن طريق إدخال أول متري تعلم
هناك فرق حاسم بين تلخيص المستندات الفردية والمتعددة هو كيف يتجلى المحتوى البارز نفسه في المستند (المستندات). على الرغم من أن هذا المحتوى قد يظهر في بداية وثيقة واحدة، إلا أن المعلومات الأساسية تكرر بشكل متكرر في مجموعة من المستندات المتعلقة بموضوع مع
الOCT وسيلة تشخيصية حديته لفحص الأنسجة بشكل غير جارح .بدئ استخدامها في الممارسة السريرية منذ عام 1995 و يشبه تصوير التماسك البصري المقطعي التصوير بالأمواج فوق الصوتية من حيث أنه يعتمد مبدأ التقاط الصدى إلا الأمواج الضوئية بدلاً من الأمواج فوق الصوتية