ترغب بنشر مسار تعليمي؟ اضغط هنا

التطبيقات القائمة على البيانات العلمية هي ذات أهمية متزايدة من أي وقت مضى.ينتج عن هذا العيوب للمناطق التي لا تتوفر فيها بيانات عالية الجودة وأنظمة متوافقة، مثل المنشورات غير الإنجليزية.لتعزيز تخفيف هذا الخلل، نستخدم منشورات البرنامج النصي السيريلية م ن المجموعة الأساسية لإنشاء مجموعة بيانات عالية الجودة لاستخراج البيانات الوصفية.نستخدم بياناتنا للتدريب وتقييم نماذج وضع التسلسل لاستخراج معلومات العنوان والمؤلف.إعادة تدريب جروبيد على بياناتنا، نلاحظ تحسينات كبيرة من حيث الدقة وتذكر وتحقيق نتائج أفضل مع نموذج متطور بنفسي.نجعل بياناتنا مجموعة تغطي أكثر من 15000 منشورات بالإضافة إلى شفرة المصدر لدينا بحرية.
لقد شهدت النماذج الكبيرة الاحترادية نجاحا هائلا في مهام تلخيص الاستخراجية.في هذا العمل، يمكننا التحقيق في تأثير الاحتجاج على نظام تلخيص استخراج استخراج بيرت للوثائق العلمية.نحن نستمد تحسينات كبيرة من الأداء باستخدام خطوة محاكاة وسيطة تستفيد من مجموعا ت بيانات التلخيص الحالية والإبلاغ عن نتائج أحدث النتائج في مجموعة بيانات التلخيص العلمية التي تم إصدارها مؤخرا، SCITLDR.نقوم بتحليل خطوة محاكاة الوسيطة بشكل منهجي عن طريق تغيير حجم ومجال الإصلاح، وتغيير طول تسلسل الإدخال في المهمة المستهدفة والمهام المستهدفة المتغيرة.نحن نحقق أيضا كيف يتفاعل الوسيطة التي تتفاعل مع تضمين الكلمات السياقية المدربة على المجالات المختلفة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا