غالبا ما يكون اختلاف الفرد في أسلوب الكتابة وظيفة من السمات الاجتماعية والشخصية. في حين أن التباين الاجتماعي المنظم قد درس على نطاق واسع، مثل التباين القائم على النوع الاجتماعي، فإن أقل بكثير معروف حول كيفية وصف الأساليب الفردية بسبب طبيعتها الخصوصية. نقدم نهجا جديدا لدراسة idiolects من خلال مقارنة هائلة للمؤلف عبر المؤلف لتحديد وترميز الميزات الأسلوبية. يحقق النموذج العصبي الأداء القوي في تحديد التأليف على النصوص القصيرة ومن خلال مهمة التحقيق القائم على التشبيه، يظهر أن التمثيلات المستفادة تظهر منتديات مفاجئة ترميز التحولات النوعية والكمية من الأساليب القطرية. من خلال اضطراب النص، نحدد المساهمات النسبية للعناصر اللغوية المختلفة على التباين الاضطراب. علاوة على ذلك، فإننا نقدم وصفا ل idiolects من خلال قياس الاختلاف بين المؤلفين و interra، مما يدل على أن الاختلاف في idiolects غالبا ما يكون مميزا بعد متسقة.
An individual's variation in writing style is often a function of both social and personal attributes. While structured social variation has been extensively studied, e.g., gender based variation, far less is known about how to characterize individual styles due to their idiosyncratic nature. We introduce a new approach to studying idiolects through a massive cross-author comparison to identify and encode stylistic features. The neural model achieves strong performance at authorship identification on short texts and through an analogy-based probing task, showing that the learned representations exhibit surprising regularities that encode qualitative and quantitative shifts of idiolectal styles. Through text perturbation, we quantify the relative contributions of different linguistic elements to idiolectal variation. Furthermore, we provide a description of idiolects through measuring inter- and intra-author variation, showing that variation in idiolects is often distinctive yet consistent.
المراجع المستخدمة
https://aclanthology.org/
في السنوات الأخيرة، الأعمال التجارية العالمية في المناقشات عبر الإنترنت وتقاسم الرأي حول وسائل التواصل الاجتماعي مزدهرة. وبالتالي، يقترح ذلك مهمة التنبؤ بإعادة الدخول لمساعدة الناس على تتبع المناقشات التي يرغبون في الاستمرار فيها. ومع ذلك، فإن الأعما
تهدف الترجمة التكيفية إلى تضمين ملاحظات المستخدمين بشكل حيوي لتحسين جودة الترجمة. في سيناريو ما بعد التحرير، يتم إدراج تصحيحات المستخدم لإخراج الترجمة الآلي باستمرار في نماذج الترجمة، أو تقليل أو إلغاء تحرير الأخطاء المتكررة وزيادة فائدة الترجمة الآل
نحن نستخدم التعرف على قانون الحوار (دار) للتحقيق في مدى امتثال بيرت الانتحال في الحوار، وكيف تساهم بضبط الدقيقة والتدريب المسبق على نطاق واسع في أدائها.نجد أنه في حين أن كل من التدريبات القياسية السابقة للتدريب والإحاطاء على البيانات التي تشبه الحوار
تنشئ المنصات والمجتمعات عبر الإنترنت معاييرها التي تحكم السلوك المقبول داخل المجتمع.ركز جهد كبير في NLP على تحديد السلوكيات غير المقبولة، وفي الآونة الأخيرة، على التنبؤ بها قبل حدوثها.ومع ذلك، ركزت هذه الجهود إلى حد كبير على السمية باعتبارها الشكل ال
يستخدم الأشخاص من المنتديات عبر الإنترنت إما أن نبحث عن معلومات أو للمساهمة به. بسبب شعبيتها المتنامية، تم إنشاء بعض المنتديات عبر الإنترنت خصيصا لتوفير الدعم والمساعدة والآراء للأشخاص الذين يعانون من مرض عقلي. الاكتئاب هو واحد من الأمراض النفسية الأ