ترغب بنشر مسار تعليمي؟ اضغط هنا

نهج متعدد الطبق إلى التحقيق المورفوسنكت

A multilabel approach to morphosyntactic probing

309   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح استخدام مهمة مكتملة متعددة الطبق لتقييم تمثيلات مورفوسنيتشية ل Adgeddings Word متعددة اللغات. هذا القرص في التحقيق الكنسي يجعل من السهل استكشاف تمثيلات مورفوسنيتشية، كلاهما بشكل كلي وعلى مستوى الميزات الفردية (على سبيل المثال، النوع الاجتماعي والعدد والحالة)، ويؤدي بشكل طبيعي إلى دراسة كيفية تعامل نماذج اللغة بالميزات المشتركة (على سبيل المثال ، ظواهر الاتفاقية). نوضح هذه المهمة مع بيرت متعددة اللغات (ديفلين وآخرون.، 2018)، تحقيقات تدريبية لسبعة لغات متنوعة من النطباء: الأفريكان، الكرواتية والفنلندية والعبرية والكورية والإسبانية والتركية. من خلال هذا النموذج البسيط ولكن القوي، نتحقق من أن الرصاص متعدد اللغات يتجه العديد من ميزات مورفوستينكتاكيتش في وقت واحد قابل للاستخراج. سنقوم كذلك بتقييم تحقيقات على ست لغات محمولة: العربية والصينية والماراثية والسلوفينية والتغالوغ و Yoruba. يحتوي هذا النمط المرتفع من التحقيق الصفرية على الاستفادة الإضافية للكشف عن الخصائص الشاملة اللغوية نموذج لغة يعترف بأنه مشترك لغات متعددة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

حفز الأداء المتميز لنماذج اللغة القائمة على المحولات في مجموعة كبيرة ومتنوعة من المهام NLP و NLU الاهتمام باستكشاف أعمالها الداخلية. ركزت الأبحاث الحديثة بشكل أساسي على ظواهر لغوية عالية المستوى ومعقدة مثل بناء الجملة والدلالات والمعرفة العالمية والف ني المشترك. غالبية الدراسات هي أنجلجة، ولا تزال قليلا معروفة فيما يتعلق باللغات الأخرى، وتحديدا خصائص مورفوسينتانية. تحقيقا لهذه الغاية، يقدم عملنا دعوة مورف، وهو مجموعة من 46 مهام التحقيق لأربعة لغات الهند الهندية في التشكل المختلفة: الروسية والفرنسية والإنجليزية والألمانية. نقترح نوعا جديدا من المهام التحقيق بناء على الكشف عن اضطرابات الجملة الموجهة. نحن نستخدم مزيج من تقنيات التثبيت التابعة للطبقة العصبية والطبقة والتمثيل لتحليل المحتوى المورفوسنكتاكسي لأربعة محولات متعددة اللغات، بما في ذلك إصداراتهم المقطوعة. بالإضافة إلى ذلك، ندرس كيف تؤثر ضبط مهمة وضع العلامات على الأداء التحقيق.
تعرف مهمة تحويل نص غير قياسي إلى نص قياسي وقابل للقراءة باسم التطبيع المعجمي. تتطلب جميع تطبيقات معالجة اللغة الطبيعية تقريبا (NLP) البيانات النصية في النموذج الطبيعي لإنشاء نماذج محددة ذات جودة عالية. وبالتالي، فقد ثبت التطبيع المعجمي لتحسين أداء ال عديد من مهام معالجة اللغة الطبيعية على وسائل التواصل الاجتماعي. تهدف هذه الدراسة إلى حل مشكلة التطبيع المعجمي من خلال صياغة مهمة التطبيع المعجمية مشكلة وضع علامة تسلسل. تقترح هذه الورقة نهج وضع علامة تسلسل لحل مشكلة التطبيع المعجمي في تركيبة مع تقنية محاذاة الكلمة. الهدف هو استخدام نموذج واحد لتطبيع النص باللغات المختلفة وهي الكرواتية والدنماركية والهولندية والإنجليزية والإندونيسية والإنجليزية والألمانية والإيطالية والصربية والسلوفينية والإسبانية والتركية والتركية والألمانية والألمانية. هذه مهمة مشتركة في عام 2021 ورشة العمل السابعة حول النص الناتج عن المستخدم الصاخب (W-NUT) "" من المتوقع أن يقوم المشاركون بإنشاء نظام / نموذج يقوم بتنفيذ التطبيع المعجمي، وهو ترجمة النصوص غير القانونية في تعادلهم الكنسي، الذين يشتملون على بيانات من أكثر من 12 لغة. يحقق النموذج المتعدد اللغوي المقترح نتيجة ERS الإجمالية من 43.75 بشأن التقييم الجوهري ونتيجة إجمالي درجة المرفقات (LAS) من 63.12 على التقييم الخارجي. علاوة على ذلك، تحقق الطريقة المقترحة أعلى نقاط معدل تخفيض الأخطاء (ERR) من 61.33 من بين المشاركين في المهمة المشتركة. تسلط هذه الدراسة الضوء على آثار استخدام بيانات تدريب إضافية للحصول على نتائج أفضل وكذلك استخدام نموذج لغة مدرب مسبقا تدرب على لغات متعددة بدلا من لغة واحدة فقط.
دراسات الترجمة وبشكل أكثر تحديدا، هي دراسات الترجمة الوصفية الفرعية [هولمز 1988/2000]، وفقا للعديد من العلماء [جامبير، 2009؛ Nenopoulou، 2007؛ Munday، 2001/2008؛ هيرميران، 1999؛ Snell-Hornby et al.، 1994 E.T.C]، وهو مجال دراسي متعدد التخصصات للغاية. الهدف من الورقة الحالية هو وصف دور كورسيا PolySemiotic في دراسة توطين موقع الجامعة من منظور متعدد التخصصات. وبشكل أكثر تحديدا، تقدم الورقة نظرة عامة على بحث مستنقع مستمر حول تكوين هوية مواقع الويب الجامعية اليونانية على الويب، مع التركيز على المنهجية المعتمدة بالإشارة إلى تجميع كوربورا بناء على الأدوات والمفاهيم المنهجية من مختلف المجالات مثل دراسات الترجمة مثل دراسات الترجمة والطبيون الاجتماعية والدراسات الثقافية وتحليل الخطاب النقدي والتسويق. إن كائنات التحليل المقارن هي المواقع الجامعية اليونانية والفرنسية الأصلية والمترجمة (إلى الإنجليزية) بالإضافة إلى إصدارات موقع الجامعة البريطانية والأمريكية الأصلية. لقد أظهرت نتائج البحث حتى الآن أن Corpora PolySemiotic يمكن أن تكون أداة قيمة ليس فقط من الكمية فقط ولكن أيضا من التحليل النوعي لتوطين الموقع لكل من العلماء ومهنيي الترجمة العاملين مع الأنواع متعددة الوسائط.
نحن نبحث في التمثيلات التي تعلمناها عن طريق الرؤية ونماذج اللغة في المهام التي تتطلب التفكير العلائقي.مع التركيز على مشكلة تقييم الحجم النسبي للكائنات في السياقات البصرية مجردة، نحلل منطق واحد وخطوتين.بالنسبة لهذا الأخير، نبني مجموعة بيانات جديدة من مشاهد ثلاثية وتحدد مهمة تتطلب منطق على مستوى الصور الفردية وعبر الصور في مشهد.نحن نبذل تمثيلات النموذج المستفادة باستخدام مصنفات التشخيص.تظهر تجاربنا أن الهندسة المعاد المسبدة مسبقا القائمة على المحولات يمكن أن تؤدي من التفكير العلائقي المستوى الأعلى، وهي قادرة على تعلم تمثيلات المهام والبيانات الجديدة التي تختلف عن ما شوهد في الاحتجاج.
توليد الحوار المكيف يعاني من ندرة الردود المسمى.في هذا العمل، استغلالنا بيانات نصية غير حوار مرتبطة بالشرط، والتي هي أسهل بكثير لجمعها.نقترح نهج تعليمي متعدد المهام للاستفادة من كل من الحوار والبيانات النصية المسمى.تقوم المهام الثلاثة بتحسين نفس مهمة توليد الحوار المحول مدببت مسبقا على بيانات الحوار المسمى، ومهمة ترميز اللغة مشروطة ومهمة توليد اللغة مشروطة على البيانات النصية المسمى.تظهر النتائج التجريبية أن نهجنا يتفوق على النماذج الحديثة من خلال الاستفادة من النصوص المسمى، كما أنه يحصل أيضا على تحسين أكبر في الأداء مقارنة بالطرق السابقة لاستفادة البيانات النصية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا