نحن نعتبر مهمة ربط حسابات وسائل الاعلام الاجتماعية التي تنتمي إلى المؤلف نفسه في أزياء آلية على أساس المحتوى والبيانات التعريف لتدفقات المستندات المقابلة.نركز على تعلم التضمين الذي يقوم بخرائط عينات ذات حجم متغير من نشاط المستخدم - بدءا من مشاركات واحدة بأكمله أشهر من النشاط - إلى مساحة متجهية، حيث عينات من نفس خريطة المؤلف إلى النقاط القريبة.لا يتطلب نهجنا بيانات مشروح من البشر لأغراض تدريبية، مما يتيح لنا الاستفادة من كميات كبيرة من محتوى وسائل التواصل الاجتماعي.تتفوق النموذج المقترح على العديد من خطوط الأساس التنافسية بموجب إطار تقييم رواية على غرار بعد معايير الاعتراف المنشأة في مجالات أخرى.إن طريقتنا تحقق دقة ربط عالية، حتى مع عينات صغيرة من الحسابات غير المرجة في وقت التدريب، شرط أساسي للتطبيقات العملية لإطار الارتباط المقترح.
We consider the task of linking social media accounts that belong to the same author in an automated fashion on the basis of the content and meta-data of the corresponding document streams. We focus on learning an embedding that maps variable-sized samples of user activity--ranging from single posts to entire months of activity--to a vector space, where samples by the same author map to nearby points. Our approach does not require human-annotated data for training purposes, which allows us to leverage large amounts of social media content. The proposed model outperforms several competitive baselines under a novel evaluation framework modeled after established recognition benchmarks in other domains. Our method achieves high linking accuracy, even with small samples from accounts not seen at training time, a prerequisite for practical applications of the proposed linking framework.
المراجع المستخدمة
https://aclanthology.org/
هناك مصلحة ناشئة في تطبيق نماذج معالجة اللغة الطبيعية لمهام معالجة التعليمات البرمجية المصدر.أحد المشاكل الرئيسية في تطبيق التعلم العميق لهندسة البرمجيات هو أن الكود المصدري غالبا ما يحتوي على الكثير من المعرفات النادرة، مما يؤدي إلى مفردات ضخمة.نقتر
يعتبر التعلم العميق القلب النابض للذكاء الصنعي في السنوات الأخيرة، وفي ظل تراوح تطبيقاته بين السيارات ذاتية القيادة وصولًا إلى التحليلات الطبية وغير ذلك، وقدرته على حل المشاكل المعقدة متفوقًا على الإنسان في الكثير من الأحيان، بدا أننا وصلنا للحل النه
مكنت نماذج اللغة العصبية العميقة مثل بيرت التطورات الأخيرة في العديد من مهام معالجة اللغة الطبيعية. ومع ذلك، نظرا للجهد والتكلفة الحاسوبية المشاركة في التدريب المسبق لها، يتم إدخال هذه النماذج عادة فقط لعدد صغير من لغات الموارد عالية الوزن مثل اللغة
هذا الكتاب تم وضعه من قبل ثلاثة خبراء في المجال, وهو الكتاب الوحيد الذي يشرح تفاصيل واضحة في هذا الموضوع - ايلون موسك
تم عرض التعلم النشط للحد من متطلبات التوضيحية للعديد من مهام معالجة اللغة الطبيعية، بما في ذلك وضع العلامات الدلالية (SRL).تنطوي SRL على وسيطة وسيطة تمتد من أجل المحتمل أن يحتمل أن يتسرب المتعددة في جملة، مما يجعل من الصعب تجميع القرارات العديدة في د