بينما توجد عشرات من اللغات الطبيعية، ولكل منها ميزاتها الفريدة والخصوصيات، فإنهم جميعهم يشتركون موضوع موحد: تمكين التواصل البشري.قد نتوقع ذلك بشكل معقول أن أشكال الإدراك البشرية كيف تتطور هذه اللغات وتستخدم.على افتراض أن القدرة على معالجة المعلومات ثابتة تقريبا عبر السكان البشري، نتوقع أن تنظر إلى مفاضلة مفاجأة مدةنقوم بتحليل هذه المفاضلة باستخدام Corpus من 600 لغة، وبعد التحكم في العديد من الارتباطات المحتملة، نجد أدلة داعمة قوية في كلا الإعدادتين.على وجه التحديد، نجد أنه في المتوسط، يتم إنتاج الهواتف أسرع بلغات حيث تكون أقل إثارة للدهشة والعكس.علاوة على ذلك، نؤكد أن الهواتف الأكثر إثارة للدهشة هي أطول، في المتوسط، في 319 لغة من أصل 600. وبالتالي نستنتج أن هناك أدلة قوية على مفاضلة مفاجأة مدة العمل في العملية، سواء بلغت لغات العالم وداخلها.
While there exist scores of natural languages, each with its unique features and idiosyncrasies, they all share a unifying theme: enabling human communication. We may thus reasonably predict that human cognition shapes how these languages evolve and are used. Assuming that the capacity to process information is roughly constant across human populations, we expect a surprisal--duration trade-off to arise both across and within languages. We analyse this trade-off using a corpus of 600 languages and, after controlling for several potential confounds, we find strong supporting evidence in both settings. Specifically, we find that, on average, phones are produced faster in languages where they are less surprising, and vice versa. Further, we confirm that more surprising phones are longer, on average, in 319 languages out of the 600. We thus conclude that there is strong evidence of a surprisal--duration trade-off in operation, both across and within the world's languages.
المراجع المستخدمة
https://aclanthology.org/
كيف تشرح بيل غيتس إلى الألمانية؟يرتبط بتأسيس شركة في الولايات المتحدة، لذلك ربما يمكن للمؤسس الألماني كارل بنز أن يقف في البوابات في تلك السياقات.يسمى هذا النوع من الترجمة التكيف في مجتمع الترجمة.حتى الآن، لم تتم هذه المهمة بشكل حسابي.يمكن استخدام ال
إن التقاط معنى كلمة في السياق والتمييز بين المراسلات والاختلافات عبر اللغات هو مفتاح بناء نماذج تمثيل نصية متعددة اللغات والنجاح. ومع ذلك، فإن مجموعات بيانات التقييم المتعددة اللغات الحالية التي تقيم الدلالات المعجمية في السياق "لها قيود مختلفة. على
تعتمد أنظمة متعددة اللغات متعددة اللغات على المفردات المشتركة التي تغطي جميع اللغات التي تغطي بما فيه الكفاية. تحقيقا لهذه الغاية، فإن النهج البسيط والمستعمل بشكل متكرر يستفيد من مفهليات الكلمات الفرعية التي تم إنشاؤها بشكل مشترك على عدة لغات. نحن نف
أصبحت نماذج لغة ملثم بسرعة قياسي فعلي عند معالجة النص. في الآونة الأخيرة، اقترح العديد من الأساليب زيادة إثراء تمثيلات Word مع مصادر المعرفة الخارجية مثل الرسوم البيانية المعرفة. ومع ذلك، يتم وضع هذه النماذج وتقييمها في إعداد أحادي فقط. في هذا العمل،
في حين أن العواطف جوانب عالمية لعلم النفس البشري، يتم التعبير عنها بشكل مختلف عبر لغات وثقافات مختلفة.نقدم مجموعة بيانات جديدة من أكثر من 530K منشورات عامة من الفيسبوك المجففة في 18 لغة، والتي تحمل تصنيفها بخمس عواطف مختلفة.باستخدام Asbeddings Bert م