تقدم هذه الورقة طريقة لتحديد أنماط قواعد اللغة الثنائية الثابتة وتستقل مثيلات العبارات ثنائية اللغة من زوج الجملة الإنجليزي - الصينية.في نهجنا، يتم تحليل زوج الجملة الإنجليزية الصينية لتحديد أنماط القواعد الإنجليزية والنظرات الصينية.تنطوي الطريقة على توليد ترجمات كل نمط قواعد اللغة الإنجليزية وحساب احتمال ترجمة الكلمات من كورسا الموازية الكلمة المحاذاة.تسمح لنا النتائج باستخراج أزواج العبارات الإنجليزية الأكثر احتمالا في زوج الجملة.نقدم نظام نموذجي ينطبق الطريقة لاستخراج أنماط القواعد والعبارات في الجمل الموازية.يوضح التقييم بشأن الأمثلة المختارة بشكل عشوائي من القاموس أن نهجنا لديه أداء جيد بشكل معقول.نحن نستخدم قاضي الإنسان لتقييم العبارات الثامنة الناتجة عن طريقنا.النتائج لديها إمكانية مساعدة تعلم اللغة وأبحاث الترجمة الآلية.
This paper presents a method for automatically identifying bilingual grammar patterns and extracting bilingual phrase instances from a given English-Chinese sentence pair. In our approach, the English-Chinese sentence pair is parsed to identify English grammar patterns and Chinese counterparts. The method involves generating translations of each English grammar pattern and calculating translation probability of words from a word-aligned parallel corpora. The results allow us to extract the most probable English-Chinese phrase pairs in the sentence pair. We present a prototype system that applies the method to extract grammar patterns and phrases in parallel sentences. An evaluation on randomly selected examples from a dictionary shows that our approach has reasonably good performance. We use human judge to assess the bilingual phrases generated by our approach. The results have potential to assist language learning and machine translation research.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نقدم مجموعة بيانات توصية ثنائية اللغة بالتوازي ثنائية اللغة (Dreecdial 2.0) لتمكين الباحثين من استكشاف مهمة صعبة في توصية محادثة متعددة اللغات ومتعددة اللغات. الفرق بين Dreecdial 2.0 ومجموعات بيانات توصية المحادثة الحالية هو أن عنصر ال
حققت نماذج متعددة اللغات المدربة مسبقا أداء ملحوظا على تعلم التحويل عبر اللغات.تم تدريب بعض النماذج متعددة اللغات مثل Mbert، مدربة مسبقا على Corpora غير المسبق، وبالتالي لا يمكن تضمين تضمينات لغات مختلفة في النماذج بشكل جيد للغاية.في هذه الورقة، نهدف
تتمثل إدارة المصطلح والمصطلان بخطوات حيوية لإعداد كل أخصائي لغة، ولعب دورا مهما للغاية في مرحلة تعليم محترفي الترجمة.يتزايد الاتجاه المتزايد من إدارة الوقت الفعالة والقيود الزمنية المستمرة التي قد نلاحظها في كل قطاع عمل بزيادة ضرورة تجميع المسرد التل
العديد من الأعمال الحديثة في إظهار كلمة التحليل المعجمي ثنائي اللغة (BLI) Word Adgetdings كمنتجات في الفضاء Euclidean.على هذا النحو، يتم حلها عادة من خلال العثور على تحول خطي يقوم بخرائط Ageddings إلى مساحة مشتركة.بدلا من ذلك، قد تكون مفهومة Word Age
في هذه الورقة ونحن نستكشف تقنيات مختلفة للتغلب على تحديات الموارد المنخفضة في الترجمة الآلية العصبية (NMT) وتركز على وجه التحديد على حالة اللغة الإنجليزية الماراثية NMT. تتطلب أنظمة NMT كمية كبيرة من كورسا الموازية للحصول على ترجمات ذات نوعية جيدة. ن