ترغب بنشر مسار تعليمي؟ اضغط هنا

The Corpora هم متغيرون: دراسة حالة في الصحف الإيطالية

The Corpora They Are a-Changing: a Case Study in Italian Newspapers

178   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أدى استخدام الأساليب التلقائية لدراسة التغيير الدلالي المعجمي (LSC) إلى إنشاء معايير التقييم.ومع ذلك، يتم ربط مجموعات البيانات القياسية بالجوربوس المستخدمة لإنشائها استجواب موثوقيتها وكذلك متانة الأساليب التلقائية.تحقق هذه المساهمة في هذه الجوانب التي توضح تأثير الأبعاد الاجتماعية والثقافية غير المتوقعة.نحن نحدد أيضا مجموعة من المشكلات الإضافية (جودة التعرف الضوئي على الحروف بالإنترنت، والكيانات المسماة) التي تؤثر على أداء الأساليب التلقائية، خاصة عند استخدامها لاكتشاف LSC.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أدت نماذج اللغة الكبيرة إلى إحراز تقدم ملحوظ في العديد من مهام NLP، ويتحول الباحثون إلى نصائح نصية أكبر من أي وقت مضى لتدريبهم. يتم تقديم بعض أكبر الشركات المتاحة من خلال تجريف أجزاء مهمة من الإنترنت، ويتم إدخالها بشكل متكرر مع الحد الأدنى فقط من الو ثائق. في هذا العمل، نقدم بعض الوثائق الأولى لجور الزحف النظيف الهائل (C4؛ Raffel et al.، 2020)، مجموعة بيانات تم إنشاؤها عن طريق تطبيق مجموعة من المرشحات إلى لقطة واحدة من الزحف المشترك. نبدأ بالتحقيق في المكان الذي جاءت فيه البيانات، وإيجاد كمية كبيرة من النص من مصادر غير متوقعة مثل براءات الاختراع ومواقع الويب العسكرية الأمريكية. ثم نستكشف محتوى النص نفسه، وإيجاد نص تم إنشاؤه بواسطة الجهاز (E.G.، من أنظمة الترجمة الآلية) وأمثلة التقييم من مجموعات بيانات NLP القياسية الأخرى. لفهم تأثير المرشحات المطبقة على إنشاء هذه البيانات، نقوم بتقييم النص الذي تمت إزالته، وإظهار أن تصفية Blocklist تزيل النص غير متناسب من الأفراد وأصحاب الأقليات. أخيرا، نستنتج بعض التوصيات حول كيفية إنشاء وتوثيق مجموعات بيانات الويب من كشط الإنترنت.
دراسات الترجمة وبشكل أكثر تحديدا، هي دراسات الترجمة الوصفية الفرعية [هولمز 1988/2000]، وفقا للعديد من العلماء [جامبير، 2009؛ Nenopoulou، 2007؛ Munday، 2001/2008؛ هيرميران، 1999؛ Snell-Hornby et al.، 1994 E.T.C]، وهو مجال دراسي متعدد التخصصات للغاية. الهدف من الورقة الحالية هو وصف دور كورسيا PolySemiotic في دراسة توطين موقع الجامعة من منظور متعدد التخصصات. وبشكل أكثر تحديدا، تقدم الورقة نظرة عامة على بحث مستنقع مستمر حول تكوين هوية مواقع الويب الجامعية اليونانية على الويب، مع التركيز على المنهجية المعتمدة بالإشارة إلى تجميع كوربورا بناء على الأدوات والمفاهيم المنهجية من مختلف المجالات مثل دراسات الترجمة مثل دراسات الترجمة والطبيون الاجتماعية والدراسات الثقافية وتحليل الخطاب النقدي والتسويق. إن كائنات التحليل المقارن هي المواقع الجامعية اليونانية والفرنسية الأصلية والمترجمة (إلى الإنجليزية) بالإضافة إلى إصدارات موقع الجامعة البريطانية والأمريكية الأصلية. لقد أظهرت نتائج البحث حتى الآن أن Corpora PolySemiotic يمكن أن تكون أداة قيمة ليس فقط من الكمية فقط ولكن أيضا من التحليل النوعي لتوطين الموقع لكل من العلماء ومهنيي الترجمة العاملين مع الأنواع متعددة الوسائط.
تصف هذه الورقة دراسة حالة وثقت خلالها ستة من أمثلة التغييرات ثم حللت باتجاهين الأول يتعلق بتقييم كفاءة أدوات الBIM اتجاه تغييرات التصميم و اكتشاف نقاط ضعفها و الثاني يتعلق بتحليل خصائص هذه التغييرات ضمن نموذج معلومات الBIM و تقديمها في نمذجة لعملية التغيير.
يعد الترتيب تعليقات المستخدمين المنشورة على مقالة إخبارية مهمة بالنسبة لخدمات الأخبار عبر الإنترنت لأن رؤية التعليق تؤثر بشكل مباشر على تجربة المستخدم.أبحاث التعليقات في الترتيب مع مقاييس مختلفة لقياس جودة التعليق قد أظهرت بناءة "" المستخدمة في تحليل الحجة واعدة من وجهة نظر عملية.في هذه الورقة، نبلغ عن دراسة حالة يتم فيها فحص هذه المنشأة في العالم الحقيقي.على وجه التحديد، نقوم بفحص مسابقة داخلية لتحسين أداء التعليقات البناءة الترتيب وإظهار فعالية أفضل نموذج للحصول على خدمة تجارية.
تقدم التطورات الحديثة في الترجمة الآلية العصبية غير المدعومة (IPNMT) من الفجوة بين أداء ترجمة الآلات الخاضعة للإشراف وغير المعروضة لأزواج اللغة ذات الصلة عن كثب. ومع ذلك، والوضع مختلف جدا على أزواج اللغة البعيدة. يؤدي نقص التداخل في المعجم وانخفاض ال تشابه النحوي، مثل اللغة الإنجليزية واللغات الهندية إلى ضعف جودة الترجمة في أنظمة IPS الحالية. في هذه الورقة، نعرض أن تهيئة طبقة التضمين من طرازات التضمين من طرازات بروتوكول الكثال الكثال الكربون البرمجية مع ادبات متبلة يؤدي إلى تحسينات نقاط بلو كبيرة على نماذج IPS الحالية حيث تتم تهيئة أوزان طبقة تضمينها بشكل عشوائي. مما يؤدي وتجميد الأوزان طبقة التضمين إلى تحسين مكاسب أفضل مقارنة بتحديث أوزان طبقة تضمينها أثناء التدريب. لقد جربنا باستخدام تسلسل ملثمين للتسلسل (الكتلة) وتدينك مناهج AUTONCONDER (DAE) لنهج البث لمدة ثلاث أزواج لغة بعيدة. تهيئة تضمين التضمين المتبادلة المقترحة تحسن نتيجة بلو ما يصل إلى عشر مرات فوق خط الأساس للإنجليزية-الهندية والإنجليزية-البنغالية والإنجليزية-الغوجاراتية. يوضح تحليلنا أن تهيئة طبقة التضمين مع رسم خرائط تضمين التضمين الساكنة ضرورية لتدريب نماذج بعثة الأمم المتحدة في غول الرصاص على أزواج اللغة البعيدة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا