ترغب بنشر مسار تعليمي؟ اضغط هنا

بناء كوربوس لمواقع الويب التقييم لتقييم الترجمة.خطوة بخطوة منهجية منهجية

Building a Corpus for Corporate Websites Machine Translation Evaluation. A Step by Step Methodological Approach

396   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الهدف من هذه الورقة هو وصف العملية التي يتم تنفيذها لتطوير كوربوس في LEL يتألف من النصوص المستخرجة من مواقع الشركات الصغيرة والمتوسطة في جنوب شركات الأسفلية من القطاعات الصحية التي ستكون بمثابة أساس لتقييم جودة MT. مراحل تجميع الشركة الموازية كانت: (1) اختيار المواقع ذات المحتوى المترجم في اللغة الإنجليزية والإسبانية، (2) تنزيل ملفات HTML من مواقع الويب المحددة، (3) الملفات تصفية الملفات الإنجليزي وإقرانها مع مكافئات اللغة الإنجليزية (4) تجميع كوربورا الفردية (EN و ES) لكل من مواقع الويب المحددة، (V) دمج الأفراد الفردي إلى كوربوس عامين واحد باللغة الإنجليزية والآخر في الإسبانية، (6) اختيار نموذج تمثيلي من يتم استخدام شرائح لاستخدامها كترجمات أصلية (EN) وترجمات مرجعية (EN)، (VII)، بناء السور الموازي المقصود لتقييم MT. سوف تعمل Corpus الموازية التي ولدت في تقييم جودة الترجمة الآلية في المستقبل. بالإضافة إلى ذلك، يمكن أن تكون شركة أحادية الناتجة التي تم إنشاؤها أثناء العملية كقاعدة لتنفيذ البحوث التي تركز على التحليل اللغوي - ثنائي اللغة أو أحادي الأجل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نصف عملية بناء كوربوس للشركات سيتم استخدامها كإعادة إرجاع للنمذجة وحوسبة المخلفات المحادثات المضمنة باستخدام أدوات Commu-Nication and Collaboration.إن AdvertGoal of the إعادة إعمار الخيوط هو "بيل" لتوفير قيمة للمصدر في حالات استخدام Va r-Ious، مثل HIGLIGHTION TANT أجزاء مناقشة تشغيل، مراجعة الالتزامات القادمة أو المواعيد النهائية، إلخ. منذ ذلك الحين، لمعرفتنا،لا يمكن أن تسمح لنا Corpus Corporwichic Gornfich للاستفادة من الناحية الفرنسية بمعالجة هذا الدستور الخيطي هذا، ونحن نقدم هنا أميثود لبناء هذه الجوانب والخطوات التي سمحت للخطوات التي سمحت للخطوط الدقيقة لخط أنابيب إلى Pseudo-Anonymessata.مثل هذا الخط الأنابيب هو استجابة للكتابات الناجمة عن البيانات العامة للبيانات المؤيدة للاتصال GDPR في أوروبا والاطلاع على سرية المراسلات.
إن السلوك العشوائي الحالي لأصحاب المصالح داخل حوض نهر الأبرش في الاقليم الساحلي السوري بما يحتويه من البحيرة والنهر يهدد أكثر من أي وقت مضى بتلويث الحوض بأكمله. الهدف من هذه الورقة هو معالجة حالة الإدارة المشتركة للموارد المائية بين اللاعبين المحليين من خلال تطبيق نظرية اللعبة على أساس استراتيجيتين مبنيتين على المصلحة الخاصة لكل لاعب للوصول إلى نقطة التوازن مع مراعاة تدخل السلطة الحكومية كمنظم للعبة . لذلك ، اعتمدت نظرية اللعبة غير التعاونية NCGT كنهج تحليلي لنمذجة تعارض أصول التخطيط، في حين تم اعتماد برنامج ArcGIS لتحديد نطاق المناطق وفقًا لأنواع المخاطر / استخدام الأراضي. توضح النتيجة أن استراتيجية نقطة التوازن لاستراتيجية "عدم التعاون -عدم التعاون" بين اللاعبين يمكن أن تميل نحو استراتيجية "تعاون- تعاون" في ضوء تأثير الجهة الحكومية المحلية المعنية عند تبني سياسات تخطيطية تنافسية مبتكرة. وهذا بدوره سيؤدي إلى توازن اقتصادي-بيئي تفاعلي في حوض النهر كما يساعد على الوصول إلى قرارات ادارية عقلانية. بالتالي، يمكن تصنيف هذه الورقة كواحدة من الدراسات التي تسعى إلى تطبيق نهج التخطيط التشاركي نحو التنمية المستدامة.
المحادثات غالبا ما تكون في المختبرات والشركات.ملخص أمر حيوي لفهم محتوى مناقشة للأشخاص الذين لم يحضروا المناقشة.إذا تم توضيح الملخص كهيكل وسيطة، فمن المفيد فهم أساسيات المناقشة على الفور.هدفنا في هذه الورقة هو التنبؤ بهيكل رابط بين العقد التي تتكون من الكلام في محادثة: تصنيف كل زوج عقدة إلى مرتبط "أو غير مرتبط." نهج واحد للتنبؤ به الهيكل هو استخدام نماذج تعلم الآلات.ومع ذلك، فإن النتيجة تميل إلى الإفراط في توليد روابط العقد.لحل هذه المشكلة، نقدم طريقة من خطوتين لمهمة التنبؤ الهيكل.نحن نستخدم نهج تعتمد على الجهاز كخطوة الأولى: مهمة تنبؤ الرابط.بعد ذلك، نطبق نهجا يستند إلى النتيجة كخطوة ثانية: مهمة اختيار الارتباط.تحسنت أساليبنا من خطوتين بشكل كبير الدقة مقارنة بطرق خطوة واحدة تستند إلى SVM و BERT.
في الآونة الأخيرة، بدأ عدد من مقدمي الترجمة الآلات التجارية (MT) تقديم ميزات مسرد يسمح للمستخدمين بتنفيذ المصطلحات في إخراج نموذج عام. ومع ذلك، على حد علمنا، ليس من الواضح كيف ستؤثر هذه الميزات على دقة المصطلحات والنوعية الشاملة للإخراج. تهدف المساهم ة الحالية إلى توفير نظرة أولية في أداء النماذج العامة المحسنة المسرد التي تقدمها أربعة مقدمي خدمات. تنطوي اختباراتنا على اثنين من المجالات المختلفة وأزواج اللغات، I.E.STSSWEAR EN - FR ومعدات صناعية DE - EN. سيتم تقييم إخراج كل طراز عام وعلى Glossaryenenhanced One الاعتماد على معدل خطأ الترجمة (TER) لمراعاة جودة الإخراج الإجمالية وعلى الدقة لتقييم الامتثال لمصطلان المسرد. يتبع ذلك تقييم يدوي. تركز المساهمة الحالية أساسا على فهم كيفية استغلال ميزات المسرد هذه بشكل مثمر من قبل مقدمي خدمات اللغة (LSPs)، وخاصة في سيناريو يتوفر فيه مشرق العميل بالفعل ويضاف إلى النموذج العام كما هو.
يقدم هذا العمل ITIHASA، مجموعة بيانات ترجمة واسعة النطاق تحتوي على 93،000 زوج من Sanskrit Shlokas وترجماتها الإنجليزية.يتم استخراج شلوكاس من اثنين من الملصفات الهندية بمعنى.، رامايانا وماهاوصفنا أولا الدافع وراء عمالة مثل هذه البيانات ومتابعة التحليل التجريبي لإظهار الفروق الدقيقة.ثم نقاشنا بعد أداء نماذج الترجمة القياسية في هذه الجثة وإظهار أنه حتى بديهيات المحولات الحديثة تؤدي بشكل سيء، مع التركيز على تعقيد مجموعة البيانات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا