معظم اللغات المفقودة التي لا تزال غير المفقودة تظهر خصائيتين تشكل تحديات فك شفرة كبيرة: (1) لا يتم تجزئة النصوص بالكامل في الكلمات؛ (2) لا يتم تحديد أقرب لغة معروفة. نقترح نموذج فك تشفير يعالج كل من هذه التحديات من خلال بناء القيود اللغوية الغنية التي تعكس أنماط ثابتة في تغيير الصوت التاريخي. نلقي التقاط الهندسة الصوتيات الطبيعية عن طريق التعلم Admanes Admingdings بناء على الأبجدية الصوتية الدولية (IPA). الإطار الولادة الناتج الناتج نماذج تجزئة الكلمات والمعالجة، على علم بالقيود الصوتية. نقيم النموذج على كل من اللغات المعتمدة (القوطية، Ugaritic) وواحدة غير ملائمة (iberian). تظهر التجارب أن دمج الهندسة الصوتية يؤدي إلى مكاسب واضحة ومتسقة. بالإضافة إلى ذلك، نقترح قياس التقارب اللغوي الذي يحدد بشكل صحيح اللغات ذات الصلة القوطية و Ugaritic. بالنسبة إلى Iberian، لا تظهر الطريقة أدلة قوية تدعم لغة الباسك بلغة ذات صلة، متفق عليها بالموقف المفضل من قبل المنح الدراسية الحالية
Most undeciphered lost languages exhibit two characteristics that pose significant decipherment challenges: (1) the scripts are not fully segmented into words; (2) the closest known language is not determined. We propose a decipherment model that handles both of these challenges by building on rich linguistic constraints reflecting consistent patterns in historical sound change. We capture the natural phonological geometry by learning character embeddings based on the International Phonetic Alphabet (IPA). The resulting generative framework jointly models word segmentation and cognate alignment, informed by phonological constraints. We evaluate the model on both deciphered languages (Gothic, Ugaritic) and an undeciphered one (Iberian). The experiments show that incorporating phonetic geometry leads to clear and consistent gains. Additionally, we propose a measure for language closeness which correctly identifies related languages for Gothic and Ugaritic. For Iberian, the method does not show strong evidence supporting Basque as a related language, concurring with the favored position by the current scholarship.1
المراجع المستخدمة
https://aclanthology.org/
البرامج النصية - تسلسل الأحداث النموذجية التي تصف الأنشطة اليومية - تساعد في فهم الروايات من خلال توفير التوقعات، وحل الغموض، وملء المعلومات غير المستحقة. ومع ذلك، حتى الآن أثبتوا صعوبة في المؤلف أو استخراج النص. في هذا العمل، نوضح لأول مرة يمكن تصوي
في هذه الورقة، نقدم مهمة التنبؤ بشدة من الجوانب التي يقيم بها العمر من محتوى السينما على أساس البرنامج النصي للحوار.إننا نحقق أولا تصنيف شدة الأفلام الترتيبية على 5 جوانب: الجنس والعنف والبهجة واستهلاك المواد المخدرة والمشاهد المخيفة.يتم التعامل مع ا
الهدف من هذه الدراسة اصلاح بعض الأخشاب الأثرية المتدهورة جزئياً، و ترميمها قبل تدهورها بشكل كامل. و لتحقيق هذا الهدف استخدمت التقانة الاشعاعية في تحضير بعض الخلائط البوليميرية مثل(بولي فينيل الكحول)( PVA ),و البولي ايثلين غليكول(PEG),و حامض الأكريليك
الجيل السردي هو مهمة NLP مفتوحة العضوية التي يولد فيها نموذج قصة إعطاء موجه.المهمة تشبه توليد الاستجابة العصبية لل Chatbots؛ومع ذلك، غالبا ما لا يتم تطبيق الابتكارات في توليد الاستجابة على جيل سرد، على الرغم من التشابه بين هذه المهام.نحن نهدف إلى سد
في هذه الورقة، نهدف إلى معالجة التحديات المحيطة بترجمة النص الصيني القديم: (1) الفجوة اللغوية بسبب الاختلاف في عصائر النتائج في الترجمات التي هي فقيرة في الجودة، و (2) تفتقد معظم الترجمات المعلومات السياقيةغالبا ما يكون هذا أمرا ضروريا للغاية لفهم ال