تحديد ما إذا كان هناك مستندان مؤلفان من المؤلف نفسه، المعروف أيضا باسم التحقق من التأليف، تم تناوله تقليديا باستخدام الأساليب الإحصائية. في الآونة الأخيرة، تم العثور على تمثيلات التأليف المستفادة باستخدام الشبكات العصبية لتفوق البدائل، لا سيما في الإعدادات الكبيرة التي تنطوي على مئات الآلاف من المؤلفين. ولكن هل تعلمت هذه التمثيلات في نقل مجال معين إلى مجالات أخرى؟ أو هل هذه تمثيلات متشابكة بطبيعتها مع ميزات خاصة بالمجال؟ لدراسة هذه الأسئلة، نقوم بإجراء أول دراسة واسعة النطاق لنقل المجال المتبادل للتحقق من التأليف بالنظر إلى التحويلات الصفرية التي تنطوي على ثلاثة مجالات متباينة: مراجعات الأمازون وقصص قصيرة الصوفية والتعليقات Reddit. نجد أنه على الرغم من أن درجة التنقل مفاجأة ممكنة بين مجالات معينة، إلا أنها ليست ناجحة بين الآخرين. نحن ندرس خصائص هذه المجالات التي تؤثر على التعميم واقتراح أساليب بسيطة ولكنها فعالة لتحسين النقل.
Determining whether two documents were composed by the same author, also known as authorship verification, has traditionally been tackled using statistical methods. Recently, authorship representations learned using neural networks have been found to outperform alternatives, particularly in large-scale settings involving hundreds of thousands of authors. But do such representations learned in a particular domain transfer to other domains? Or are these representations inherently entangled with domain-specific features? To study these questions, we conduct the first large-scale study of cross-domain transfer for authorship verification considering zero-shot transfers involving three disparate domains: Amazon reviews, fanfiction short stories, and Reddit comments. We find that although a surprising degree of transfer is possible between certain domains, it is not so successful between others. We examine properties of these domains that influence generalization and propose simple but effective methods to improve transfer.
المراجع المستخدمة
https://aclanthology.org/
ندرس مشكلة جديدة في التعلم عبر التحويلات المتبادلة لحدث القرار (ECR) حيث يتم تكييف النماذج المدربة على البيانات من لغة مصدر للتقييمات باللغات المستهدفة المختلفة. نقدم النموذج الأساسي الأول لهذه المهمة بناء على نموذج لغة XLM-Roberta، وهو نموذج لغوي مت
وثقت البحوث الحديثة أن النتائج التي تم الإبلاغ عنها في أوراق إسناد التأليف المتأتلة بشكل متكرر يصعب إنتاجها.غالبا ما يقترح الكود والبيانات التي يتعذر الوصول إليها كعوامل تمنع النسخ الناجحة.حتى عندما تتوفر المواد الأصلية، تظل المشكلات التي تمنع الباحث
تصميم التمثيلات التعبيرية للكيانات والعلاقات في الرسم البياني المعرفي هو مسعى مهم. في حين أن العديد من الأساليب الحالية تركز بشكل أساسي على التعلم من الأنماط العلائقية والمعلومات الهيكلية، فقد تم تجاهل التعقيد الجوهري لكي كيانات KG أكثر أو أقل. بشكل
تعدُّ السيرة النبوية من أقدم المؤلفات في التراث العربي الإسلامي المدوّن, و هي تكتسب أهميتها التاريخية بوصفها أسفاراً توثّق لحياة النبي الكريم محمد ( ص ) من جهة, و تنبئ عن ملامح الفكر العربي في بدايات مرحلة التأليف و الكتابة المنهجية من جهة أخرى.
و ي
إسناد التأليف هو مهمة تعيين وثيقة غير معروفة إلى مؤلف من مجموعة من المرشحين.في الماضي، تستخدم الدراسات في هذا المجال مجموعات بيانات التقييم المختلفة لإظهار فعالية الخطوات والميزات والنماذج مسبقا.ومع ذلك، فإن جزء صغير فقط من الأعمال يستخدم أكثر من مجم