ترغب بنشر مسار تعليمي؟ اضغط هنا

فك تشفير البرامج النصية القديمة العاطسة باستخدام الصوت الصوتي

Deciphering Undersegmented Ancient Scripts Using Phonetic Prior

258   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

معظم اللغات المفقودة التي لا تزال غير المفقودة تظهر خصائيتين تشكل تحديات فك شفرة كبيرة: (1) لا يتم تجزئة النصوص بالكامل في الكلمات؛ (2) لا يتم تحديد أقرب لغة معروفة. نقترح نموذج فك تشفير يعالج كل من هذه التحديات من خلال بناء القيود اللغوية الغنية التي تعكس أنماط ثابتة في تغيير الصوت التاريخي. نلقي التقاط الهندسة الصوتيات الطبيعية عن طريق التعلم Admanes Admingdings بناء على الأبجدية الصوتية الدولية (IPA). الإطار الولادة الناتج الناتج نماذج تجزئة الكلمات والمعالجة، على علم بالقيود الصوتية. نقيم النموذج على كل من اللغات المعتمدة (القوطية، Ugaritic) وواحدة غير ملائمة (iberian). تظهر التجارب أن دمج الهندسة الصوتية يؤدي إلى مكاسب واضحة ومتسقة. بالإضافة إلى ذلك، نقترح قياس التقارب اللغوي الذي يحدد بشكل صحيح اللغات ذات الصلة القوطية و Ugaritic. بالنسبة إلى Iberian، لا تظهر الطريقة أدلة قوية تدعم لغة الباسك بلغة ذات صلة، متفق عليها بالموقف المفضل من قبل المنح الدراسية الحالية



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

البرامج النصية - تسلسل الأحداث النموذجية التي تصف الأنشطة اليومية - تساعد في فهم الروايات من خلال توفير التوقعات، وحل الغموض، وملء المعلومات غير المستحقة. ومع ذلك، حتى الآن أثبتوا صعوبة في المؤلف أو استخراج النص. في هذا العمل، نوضح لأول مرة يمكن تصوي ر نماذج اللغات العصبية المدربة مسبقا لتوليد البرامج النصية عالية الجودة، في مستويات مختلفة من الحبيبية، لمجموعة واسعة من السيناريوهات اليومية (E.G.، خبز كعكة). للقيام بذلك، نقوم بجمع Growdsourced كبيرة (6.4K) من البرامج النصية التي أمرت جزئيا (المسمى المحترفات)، وهي أكبر بكثير من مجموعات البيانات السابقة، وتطوير النماذج التي تولد البرامج النصية من خلال الجمع بين توليد اللغة والتنبؤ بنية الرسم البياني. نحدد اثنين من المهام التكميلية: (1) التنبؤ الحافة: بالنظر إلى السيناريو والأحداث غير المدرجة، قم بتنظيم الأحداث في البرنامج النصي ساري المفعول (ربما بالترتيب الجزئي)، و (2) جيل البرنامج النصي: معطى سيناريو فقط، توليد الأحداث وتنظيمها في البرنامج النصي (ربما النظام الجزئي). تظهر تجاربنا أن نماذجنا تؤدي جيدا (على سبيل المثال، F1 = 75.7 في المهمة (1))، مما يوضح نهجا جديدا للتغلب على الحواجز السابقة أمام جمع البرنامج النصي. نظهر أيضا أنه لا يزال هناك مجال مهم للتحسين نحو أداء مستوى الإنسان. معا، توفر المهام الخاصة بنا ومجموعة البيانات والنماذج اتجاها بحثا جديدا لتعلم معرفة البرنامج النصي.
في هذه الورقة، نقدم مهمة التنبؤ بشدة من الجوانب التي يقيم بها العمر من محتوى السينما على أساس البرنامج النصي للحوار.إننا نحقق أولا تصنيف شدة الأفلام الترتيبية على 5 جوانب: الجنس والعنف والبهجة واستهلاك المواد المخدرة والمشاهد المخيفة.يتم التعامل مع ا لمشكلة باستخدام إطار عمل متعدد القائم على شبكة سيامي يعمل بشكل متزامن على تحسين إمكانية تفسير التنبؤات.تظهر النتائج التجريبية أن أسلوبنا تتفوق على نموذج الحالة السابقة للدولة السابقة ويوفر معلومات مفيدة لتفسير تنبؤات النموذج.يتم توفير مجموعة البيانات والمصدر المقترحة للجمهور في مستودع GitHub الخاص بنا.
الهدف من هذه الدراسة اصلاح بعض الأخشاب الأثرية المتدهورة جزئياً، و ترميمها قبل تدهورها بشكل كامل. و لتحقيق هذا الهدف استخدمت التقانة الاشعاعية في تحضير بعض الخلائط البوليميرية مثل(بولي فينيل الكحول)( PVA ),و البولي ايثلين غليكول(PEG),و حامض الأكريليك (AAc) و الأكريل أميد( AAm ) لتحسين قوى التصاق البوليمير مع الخشب و حمايته. تبين النتائج إنَّ أفضل خواص التصاق تمَّ باستخدام بولي فينيل الكحول و حامض الأكريليك و الأكريل أميد. اظهرت النتائج أنَّه بزيادة نسبة حامض الأكريليك . تزداد كل من متانة قوة اللصق، القساوة، الشفافية و الثبات الحراري. إنّ أفضل متانة لصق تمَّ الحصول عليها كانت MPa 4.79 للخلطة التي تحتوي % 18 حامض الأكريليك و% 6 أكريل أميد و % 12 بولي فينيل الكحول عند التعرض لجرعة أشعة فوق بنفسجية بمقدار 210 [Gry]. كما اظهرت النتائج ان تعرض الاخشاب لجرعة إشعاعية مقدارها 250 [Gry] كانت كافية لإجراء العقامة و التطهير.
الجيل السردي هو مهمة NLP مفتوحة العضوية التي يولد فيها نموذج قصة إعطاء موجه.المهمة تشبه توليد الاستجابة العصبية لل Chatbots؛ومع ذلك، غالبا ما لا يتم تطبيق الابتكارات في توليد الاستجابة على جيل سرد، على الرغم من التشابه بين هذه المهام.نحن نهدف إلى سد هذه الفجوة من خلال تطبيق وتقييم التقدم في طرق فك تشفير جيل الاستجابة العصبية إلى توليد السرد العصبي.على وجه الخصوص، نحن نوظف GPT-2 وأداء الأزمة عبر عتبات أخذ العينات النواة ومثبتة تنوعا فرطيا مثبطا --- على وجه التحديد، والحد الأقصى للمعلومات المتبادلة - - تحليل النتائج على معايير متعددة مع التقييم التلقائي والإنساني.نجد أن (1) أخذ عينات نواة أفضل عموما مع عتبات بين 0.7 و 0.9؛(2) الحد الأقصى لهدف المعلومات المتبادلة يمكن أن يحسن نوعية القصص التي تم إنشاؤها؛و (3) لا ترتبط مقاييس التلقائية المنشأة بشكل جيد مع الأحكام الإنسانية لجودة السرد على أي متري نوعي.
في هذه الورقة، نهدف إلى معالجة التحديات المحيطة بترجمة النص الصيني القديم: (1) الفجوة اللغوية بسبب الاختلاف في عصائر النتائج في الترجمات التي هي فقيرة في الجودة، و (2) تفتقد معظم الترجمات المعلومات السياقيةغالبا ما يكون هذا أمرا ضروريا للغاية لفهم ال نص.تحقيقا لهذه الغاية، نحسن تقنيات الترجمة السابقة عن طريق اقتراح ما يلي: نحن نورد المهمة كهجوم تنبؤ متعدد الملصقات حيث يتنبأ النموذج كل من الترجمة وعصرها الخاص.نلاحظ أن هذا يساعد على سد الفجوة اللغوية كما يتم استخدام السياق الزمني أيضا كمعلومات مساعدة.نحن نقوم بالتحقق من طريقنا على كوربوس موازية مشروح مع معلومات التسلسل الزمني وإظهار فعاليتها تجريبيا في إنتاج مخرجات الترجمة عالية الجودة.نقوم بإصدار كل من التعليمات البرمجية وبيانات البحث في المستقبل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا