ترغب بنشر مسار تعليمي؟ اضغط هنا

غالبا ما يؤدي الكتاب إلى إعادة المواد من النصوص الموجودة عند تأليف مستندات جديدة. لأن معظم المستندات لديها أكثر من مصدر واحد، لا يمكننا تتبع هذه الاتصالات باستخدام نماذج فقط من التشابه على مستوى المستند. بدلا من ذلك، تعتبر هذه الورقة أساليب الكشف عن إعادة استخدام النص المحلي (LTRD)، والكشف عن المناطق المترجمة من نص مشابه من المعالجات أو المعلنة المضمنة بشكل غير مرتبط بطريقة غير ذات صلة. في تجارب مكثفة، ندرس الأداء النسبي لأربعة فصول من النماذج العصبية وحقيبة النماذج على ثلاثة مهام LTRD - اكتشاف الانتحال، واستخدام النمذجة للصحفيين من النشرات الصحفية، وتحديد استشهاد العلماء في الأوراق السابقة. نقوم بإجراء تقييمات على ثلاث مجموعات بيانات حالية ومجموعة بيانات جديدة ومتاحة للجمهور. تلقيت النتائج الخاصة بنا الضوء على عدد من الأسئلة غير المستكشفة سابقا في دراسة LTRD، بما في ذلك أهمية دمج السياق على مستوى المستند للتنبؤات، وتطبيق النماذج العصبية على الرف المحددة على مهام التشابه النصي الدلالي كما كشف عن الصياغة، والمفاضلات بين كيس من الكلمات الأكثر كفاءة والنماذج العصبية القائمة على الميزات وأبطأ النماذج العصبية الزوجية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا