ترغب بنشر مسار تعليمي؟ اضغط هنا

إن الفهم القراءة الآلي (MRC) هو مهمة NLP الصعبة التي يتطلبها التعامل بعناية مع جميع الحبيبات اللغوية من Word، الجملة إلى المرور.بالنسبة إلى MRC الاستخراجية، تم عرض فترة الإجابة في الغالب عن طريق الأدلة الرئيسية الوحدات اللغوية، حيث إنها جملة في معظم الحالات.ومع ذلك، اكتشفنا مؤخرا أن الجمل قد لا تكون محددة بوضوح في العديد من اللغات إلى النطاقات المختلفة، بحيث يؤدي ذلك إلى ما يسمى بمشكلة غموض وحدة الموقع ونتيجة لذلك، مما يجعل من الصعب على النموذج لتحديد الجملة التي تحتوي على تمديد الإجابة بالضبط عندماالجملة نفسها لم يتم تعريفها بوضوح على الإطلاق.مع أخذ اللغة الصينية كدراسة حالة، فإننا نوضح وتحليل هذه الظاهرة اللغوية واقترح قارئ مقابلة مع التنافق الصريح بالإجمال لتخفيف مثل هذه المشكلة.يساعد قارئنا المقترح في النهاية في تحقيق أحدث حالة جديدة في مؤشر MRC الصيني ويظهر إمكانات كبيرة في التعامل مع لغات أخرى.
تستخرف تستخرف توائم النص من النص الخام مهمة حاسمة في استخراج المعلومات، مما يتيح تطبيقات متعددة مثل ملء قواعد المعرفة أو التحقق من صحة المعرفة ومهام المصب الأخرى. ومع ذلك، فإنه عادة ما ينطوي عادة على خطوط أنابيب متعددة الخطوات التي تنتشر أخطاء أو تقت صر على عدد صغير من أنواع العلاقات. للتغلب على هذه القضايا، نقترح استخدام نماذج SEQ2SEQ AutoRegressive. لقد سبق أن ثبت أن هذه النماذج قد تؤدي بشكل جيد ليس فقط في توليد اللغة، ولكن أيضا في مهام NLU مثل ربط الكيان، بفضل تأطيرها كامرأة SEQ2SEQ. في هذه الورقة، نظهر كيف يمكن تبسيط استخراج العلاقات من خلال التعبير عن توابع توائم كسلسلة من النص، ونحن نقدم المتمردين، نموذج SEQ2SEQ يعتمد على BART يؤدي استخراج العلاقات الطرفية إلى نهاية لأكثر من 200 نوع من العلاقات المختلفة. نظهر مرونة نموذجنا من خلال ضبطه بشكل جيد على مجموعة من معايير استخراج العلاقات وعلاقة التصنيف، مع أنها تحقق أداء حديثة في معظمها.
حجم المفردات عبارة عن خيار تصميم مركزي في نماذج اللغة المحددة مسبقا كبيرة، فيما يتعلق بمتطلبات الأداء والذاكرة.عادة، يتم استخدام خوارزميات تكتيح الكلمات الفرعية مثل ترميز زوج البايت والصفحة.في هذا العمل، نحقق في توافق التوصيلات الخاصة بمساحات التضمين الثابتة والسياق متعددة اللغات واقتراح تدبير يعكس توافق التوصيلات عبر اللغات.هدفنا هو منع التوصيلات غير المتوافقة، على سبيل المثال، النبيذ "(مستوى الكلمات) باللغة الإنجليزية مقابل V. (مستوى الحرف) باللغة الفرنسية، مما يجعل من الصعب تعلم تمثيلات دلالية جيدة متعددة اللغات.نظهر أن تدبير التوافق لدينا يسمح بمصمم النظام بإنشاء مفدين عبر اللغات المتوافقة - Desideratum الذي تم إهماله حتى الآن في نماذج متعددة اللغات.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا