ترغب بنشر مسار تعليمي؟ اضغط هنا

المتوسط الكلي: أنواع نادرة مهمة أيضا

Macro-Average: Rare Types Are Important Too

333   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في حين أن مقاييس تقييم المستوى التقليدي للترجمة الآلية (MT) ترتبط بشكل جيد مع الطلاقة، فإنها تكافح لتعكس كفاية.برزت مقاييس MT مقرها النموذجية المدربة على الأحكام الإنسانية على مستوى القطاع كحل جذابة بسبب نتائج الارتباط القوي.ومع ذلك، فإن هذه النماذج تتطلب إعادة تدريب مكلفة محتملة للنطاقات واللغات الجديدة.علاوة على ذلك، فإن قراراتها غير شفافة بطبيعتها ويبدو أنها تعكس التحيزات غير المرغوب فيها.نستكشف مقياس مصنف من النوع البسيط، Macrof1، ودراسة تطبيقه على تقييم MT.نجد أن Macrof1 تنافسية على التقييم المباشر، وتتفوق على الآخرين في الإشارة إلى أداء مهام استرجاع المعلومات عبر اللغات المتبادلة.علاوة على ذلك، نوضح أن Macrof1 يمكن استخدامها لتقارن الترجمة الآلية العذبة الخاضعة للإشراف والكشف عن الاختلافات النوعية المهمة في مخرجات الأساليب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

وصلت الترجمة غير المزدئة إلى أداء مثير للإعجاب على أزواج اللغة الغنية بالموارد مثل اللغة الإنجليزية الفرنسية والإنجليزية - الألمانية. ومع ذلك، أظهرت الدراسات المبكرة أنه في بيئات أكثر واقعية تنطوي على الموارد المنخفضة، لغات نادرة، تؤدي الترجمة غير ال معينة بشكل سيئ، وتحقيق أقل من 3.0 بلو. في هذا العمل، نظير على أن تعددية اللغات أمر بالغ الأهمية لجعل أنظمة غير مخالفة عملية لإعدادات الموارد المنخفضة. على وجه الخصوص، نقدم نموذجا واحدا ل 5 لغات منخفضة الموارد (الغوجاراتية، كازاخ، النيبالية، السنهالية، والتركية) من وإلى اتجاهات اللغة الإنجليزية، والتي ترفع البيانات المتوازية غير المباشرة والمساعدة من أزواج لغة موارد أخرى عالية من خلال ثلاثة مخطط التدريب المرحلة. نحن نتفوق على جميع خطوط الأساس غير المدعومة الحالية له لهذه اللغات، وتحقيق مكاسب تصل إلى 14.4 بلو. بالإضافة إلى ذلك، نحن نتفوق خطوط خطوط خطوط خطوط خطوط أخرى تحت إشراف قوية لمختلف أزواج اللغات وكذلك تطابق أداء النموذج الحالي للإشراف على النيبالية والإنجليزية. نقوم بإجراء سلسلة من دراسات الاجتثاث لإثبات نطاقات نموذجنا بموجب درجات مختلفة من جودة البيانات، وكذلك لتحليل العوامل التي أدت إلى الأداء الفائق للنهج المقترح على النماذج التقليدية غير المعروضة.
عززت التطورات الأخيرة في توليد اللغة الطبيعية (NLG) الوسائط لصالح إعادة إدخال ترميز صريح من علاقات الخطاب في المدخلات إلى النماذج العصبية. في The Methodius Corpus، تمثيل معنى (MR) منظم هرمي ويشمل علاقات الخطاب. وفي الوقت نفسه، فقد تبين أن نماذج اللغة المدربة مسبقا مسبقا تشفير المعرفة اللغوية الغنية التي توفر موردا ممتازا ل NLG. بحكم توليف هذه الخطوط الأبحاث، نقوم بإجراء تجارب مكثفة بشأن فوائد استخدام النماذج المدربة مسبقا ومعلومات علاقة الخطاب في السيدة، مع التركيز على تحسين تماسك خطاب وتصحيحه. نعيد إعادة تصميم كوربوس المنهجية؛ ونحن أيضا بناء وجبة ثياب أخرى أخرى فيها السيدة غير هي منظم بشكل هرمي ولكنها مسطحة. نبلغ عن التجارب على إصدارات مختلفة من شركة Corga، التي تحقق عند، حيث تستفيد النماذج المدربة مسبقا من السيدة مع معلومات علاقة الخطاب فيها. نستنتج أن علاقات الخطاب تحسن بشكل كبير NLG عندما تكون البيانات محدودة.
تعتمد تقنيات AdgeDDing Word بشدة على ترددات الكلمات في Corpus، وتتأثر سلبا بفشل في تقديم تمثيلات موثوقة للكلمات ذات التردد المنخفض أو الكلمات غير المرئية أثناء التدريب. لمعالجة هذه المشكلة، نقترح خوارزمية لتعلم Admeddings عن الكلمات النادرة على أساس محرك بحث الإنترنت وعلاقات الموقع المكاني. خوارزميتنا عائدات في خطوتين. نقوم أولا باسترجاع صفحات الويب المقابلة للكلمة النادرة من خلال محرك البحث وتحليل النتائج المرسلة لاستخراج مجموعة من أكثر الكلمات ذات الصلة. نحن متوسط ​​ناقلات الكلمات ذات الصلة باعتبارها المتجه الأولي للكلمة النادرة. بعد ذلك، فإن موقع الكلمة النادرة في مساحة المتجه يتم ضبطه بشكل متكرر وفقا لترتيب ما له في الكلمات ذات الصلة. بالمقارنة مع النهج الأخرى، يمكن للخوارزمية لدينا معرفة تمثيلات أكثر دقة لمجموعة واسعة من المفردات. نقوم بتقييم شركاتنا النادرة المستفادة من الكلمات النادرة على مهمة كلمة متعلقة، وتظهر النتائج التجريبية أن خوارزميتنا تحقق الأداء الحديث من بين الفن.
في هذه المقالة سنعرض ثلاثة موضوعات، الموضوع الأول بعنوان مبرهنة الفصل و التي تضع شرطًا لازمًا و كافيًا حتى يكون العدد n أوليًا، و باقي قسمته على العدد ٤ هو واحد، و شرطًا لازمًا و كافيًا حتى يكون العدد n أوليًا و باقي قسمته على العدد ٤ هو ٣. أم ا الموضوع الثاني فيبين لنا الحد الأدنى لعدد الأعداد الأولية المحصورة بين العددين الطبيعيين ٣^n و ( n + ١ )^3 و ذلك اعتمادًا على قاعدة ثشيبتشيف التقريبية. أما الموضوع الثالث فهو تعميم لمبرهنة صوفي جرمن التي تنص على أن كل عدد من الشكل عدد طبيعي أكبر من الواحد لن يكون أوليَا.
تعد الترجمة من اقدم انواع النشاط الإنساني, فهي ظاهرة ملازمة لتاريخ الإنسان من أقدم العصور, فقد ظهرت بظهور الحاجة إلى وسيلة للتفاهم بين شعوب العالم لاختلاف أدارة التواصل بينهم. الترجمة كباقي الميادين المعرفية خضعت لقاعدة التقليد نفسها المذكورة سابق ا, حتى انك عندما تطالع كتب بعض المفكرين العرب, تجد ان طابع كتاباتهم ذات صبغة اجنبية فحديثهم عن الترجمة لا يخلو مما يشبه ماجاء به الباحثون الغرب. من الغايات المرجو بلوغها في هذا البحث: التعريف بنظرية انواع النصوص وعلاقتها بالترجمة. الكشف عن خصائص هذه النظرية في الترجمة. توضيح أهمية نظرية أنواع النصوص ودورها في اكتساب المهارات الترجمية. التحليل اللغوي للنصوص بوصفه محطة أولى تليها محطات اخرى متسقة ومنسجمة تعمل مجتمعة على تحقيق العلاقة التواصلية لمختلف أنواع النصوص. الوقوف على انواع النصوص ومن ثم أنواع المقاربات الترجمية التي تعمل على التقليل من الهوة الفاصلة بين نص المصدر ونص الوصول.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا