ترغب بنشر مسار تعليمي؟ اضغط هنا

تتبع لغة مصدر مصدر في الترجمة مع تدابير الرسم البياني ISOMORPHISM

Tracing Source Language Interference in Translation with Graph-Isomorphism Measures

196   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

استخدمت الأبحاث السابقة ميزات لغوية لإظهار أن الترجمات تظهر آثار التداخل اللغوي المصدر وأن الأشجار البلورية بين اللغات يمكن إعادة بناءها من نتائج الترجمات إلى نفس اللغة. أظهرت الأبحاث الحديثة أن مثيلات الترجمة (التداخل اللغوي المصدر) يمكن اكتشافها في مساحات تضمينها، ومقارنة مساحات الأدوات الخاصة ببيانات اللغة الأصلية مع أماكن التضمين الناتجة عن الترجمات إلى نفس اللغة، باستخدام اختلاف بسيط يستند إلى eigenvector من قياس ISOMORPHIMM. حتى الآن، لا يزال هناك سؤال مفتوح ما إذا كان يمكن إجراء تدابير البديلة البديلة البديلة البديلة نتائج أفضل. في هذه الورقة، نحن (ط) استكشاف مسافة Groomov-Hausdorff، (II) تقديم نسخة طيفية جديدة من الطريقة القائمة على eigenvector، و (III) تقييم جميع النهج مقابل قاعدة بيانات نموذجية لغوية واسعة (URIEL). نظرا لأن المسافات اللغوية الناتجة عن نهج التزييف الطيفي لدينا يمكن أن تتكاثر الأشجار الوراثية على قدم المساواة مع العمل السابق دون الحاجة إلى أي معلومات لغوية واضحة وأن النتائج يمكن تمديدها إلى اللغات غير الهندية الأوروبية. أخيرا، نظهر أن الطرق قوية تحت مجموعة متنوعة من ظروف النمذجة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

من العوامل التي تؤثر في حركة الماء في التربة خصائص التربة بتركيبها و قوامها. إن نسبة مكونات التربة من المواد المعدنية و العضوية ذات تأثير في كثافتها الظاهرية. إذ إن الترب السطحية أكثر غنى بالمادة العضوية من الترب التحتية، لذلك و بشكل عام فإن الكثافة الظاهرية تزداد مع زيادة عمق التربة، لذا هدف البحث إلى دراسة تأثير تغير الكثافة الظاهرية مع العمق في تقدم جبهة الابتلال تحت الري بالتنقيط. تضمن العمل المختبري إجراء تسعة فحوصات لمتابعة تقدم جبهة الابتلال مع الزمن، و قد استُخدِمت ثلاث حالات لتغير انحدار الكثافة الظاهرية لمقد التربة، (0.00923،0.00462،0 ) غم/سم 3/سم، المقد الأول للتربة تتغير الكثافة الظاهرية من 1.2 غم/سم 3 من سطح التربة و تدريجياً إلى 1.8 غم/سم 3 عند أقصى عمق لمقد التربة، المقد الثاني للتربة تتغير الكثافة الظاهرية من 1.5 غم/سم 3 إلى 1.8 غم/سم 3، و المقد الثالث بتربة متجانسة ذات كثافة ظاهرية 1.2 غم/سم 3 و بثلاث معدلات لإضافة الماء 1.3،2.6،3.9 سم 3 /دقيقة/سم. بينت الدراسة أن مع زيادة انحدار الكثافة الظاهرية لمقد التربة فإن هنالك زيادة قليلة في التقدم الأفقي و تكاد تنعدم هذه الزيادة في التقدم العمودي، بينما تكون واضحة و ملموسة في التقدم القطري. كما بينت أن مقدار الزيادة في التقدم العمودي هي أكبر مما عليه في التقدم الأفقي و يكون بين ذلك التقدم القطري؛ و ذلك عند زيادة معدل إضافة الماء، و إن كلا من التقدم الأفقي و التقدم العمودي و التقدم القطري لجبهة الابتلال يزداد مع نقصان معدل إضافة الماء، و ذلك عند إضافة الحجم نفسه من الماء.
تهدف التحليل الدلالي القائم على الرسم البياني إلى تمثيل معنى نصي من خلال الرسوم البيانية الموجهة. باعتبارها واحدة من أكثر تمثيلات المعنى الواعدة في مجال الأغراض العامة، اكتسبت هذه الهياكل وتحليلها زخما فائدة كبير خلال السنوات الأخيرة، مع اقتراح عدة ش كليات متنوعة. ومع ذلك، بسبب هذا التجانس للغاية، ركز معظم الجهود البحثية بشكل أساسي على الحلول الخاصة بإشعاج معين. في هذا العمل، بدلا من ذلك، نقوم بإعادة صياغة التحليل الدلالي نحو شكليات متعددة لأن الترجمة الآلية العصبية متعددة اللغات (MNMT)، واقتراح SGL، وهي عبارة عن هندسة SCL، وهي عبارة عن مورد SEQ2SEQ متعدد الاستخدامات تدربت بهدف MNMT. مدعومة بالعديد من التجارب، نظير على أن هذا الإطار فعال بالفعل بمجرد تعزيز إجراءات التعلم مع شركة فورانيا المتوازية الكبيرة القادمة من الترجمة الآلية: نحن نبلغ عن عروض تنافسية على تحليل AMR و UCCA، خاصة بمجرد إقرانها مع الهندسة المعمارية المدربة مسبقا. علاوة على ذلك، نجد أن النماذج المدربة تحت مقياس التكوين جيدا بشكل ملحوظ إلى مهام مثل تحليل AMR عبر اللغات: تفوق SGL على جميع منافسها الهامش الكبير دون رؤية أمثلة غير الإنجليزية غير الإنجليزية في وقت التدريب في وقت التدريب، وبمجرد هذه الأمثلة يتم تضمين أيضا، يحدد حالة غير مسبوقة من الفن في هذه المهمة. نطلق سردنا ونماذجنا لأغراض البحث في https://github.com/sapienzanlp/sgl.
جعلت النماذج المدربة مسبقا مثل تمثيل التشفير ثنائي الاتجاه من المحولات (بيرت)، قفزة كبيرة إلى الأمام في مهام معالجة اللغة الطبيعية (NLP).ومع ذلك، لا تزال هناك بعض أوجه القصور في مهمة نمذجة اللغة المعقدة (MLM) التي يؤديها هذه النماذج.في هذه الورقة، نق دم أول رسم بياني متعدد الأنواع بما في ذلك أنواع مختلفة من العلاقات بين الكلمات.بعد ذلك، نقترح النموذج متعدد الرسوم البياني المعزز (MG-BERT) نموذجا يعتمد على بيرتف.تضمين MG-BERT تضمين الرموز الرموز أثناء الاستفادة من الرسم البياني الثابت متعدد الرسوم البيانية التي تحتوي على حوادث مشتركة عالمية في نصوص النص بجانب الحقائق العالمية الحقيقية العالمية حول الكلمات الموجودة في رسوم المعرفة.يستخدم النموذج المقترح أيضا رسم بياني جملة ديناميكية لالتقاط السياق المحلي بشكل فعال.تظهر النتائج التجريبية أن طرازنا يمكن أن يعزز بشكل كبير الأداء في مهمة الامتيازات.
جيل القصة هي مهمة تهدف إلى إنشاء قصة ذات مغزى تلقائيا. هذه المهمة صعبة لأنها تتطلب فهما رفيع المستوى للمعنى الدلالي للجمل والسببية لأحداث القصة. تفشل نماذج NaiveSequence-To-Stuncence عموما في الحصول على هذه المعرفة، حيث يصعب ضمان صحة منطقية في نموذج جيل نصي دون تخطيط استراتيجي. في هذه الدراسة، نركز على التخطيط لسلسلة من الأحداث بمساعدة الرسوم البيانية الحدث واستخدام الأحداث لتوجيه المولد. بدلا من استخدام نموذج تسلسل إلى تسلسل لإخراج تسلسل، كما هو الحال في بعض الأعمال الموجودة، نقترح إنشاء تسلسل حدث من خلال المشي في رسم بياني حدث. يتم بناء الرسوم البيانية للحدث بناء على Corpus. لتقييم النهج المقترح، ندمج المشاركة البشرية، سواء في تخطيط الأحداث وتوليد القصة. استنادا إلى نتائج الشروح البشرية لارجكيستال، فقد ثبت أن نهجنا المقترح تقديم تسلسل وحدث صحيح منطقيا وقصصا مقارنة بالنهج السابقة.
تهدف استخراج العلاقات القائم على الحوار (إعادة) إلى استخراج العلاقة بين الحججتين التي تظهر في حوار. نظرا لأن الحوارات لديها خصائص حوادث الضمير الشخصية العالية وكثافة المعلومات المنخفضة، وبما أن معظم الحقائق العلائقية في الحوارات لا تدعمها أي جملة واح دة، فإن استخراج العلاقات القائمة على الحوار يتطلب فهم شامل للحوار. في هذه الورقة، نقترح Network Network Commany Commany Computal Network (Tucore-GCN) على غرار الاهتمام بالطريقة التي يفهم بها الناس الحوارات. بالإضافة إلى ذلك، نقترح نهج رواية يعامل مهمة الاعتراف بالمحادثات في المحادثات (ERC) كإعادة حوار قائما. تثبت التجارب في DataSet مقصورة الحوار وثلاث مجموعات بيانات ERC أن طرازنا فعال للغاية في مهام فهم اللغة الطبيعية القائمة على الحوار. في هذه التجارب، تتفوق Tucore-GCN على النماذج الحديثة على معظم مجموعات البيانات القياسية. يتوفر الكود الخاص بنا في https://github.com/blacknoodle/tucore-gcn.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا