ترغب بنشر مسار تعليمي؟ اضغط هنا

مناهج اللغويات الحسابية المتوازنة والموجهة على نطاق واسع

A Balanced and Broadly Targeted Computational Linguistics Curriculum

134   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة أن اللغويات الحاسوبية الدراسات الأولية والمناهج الخليجية في جامعة جورج تاون، وهي جامعة أمريكية شهدت نموا كبيرا في هذه المجالات في السنوات الأخيرة.نحن نفكر في المبادئ وراء اختيارات المناهج الدراسية، بما في ذلك الاعتراف بالمختلف الخلفيات الأكاديمية وأهداف طلابنا؛تدريس مجموعة متنوعة من المهارات مع التركيز على العمل مباشرة مع البيانات؛تشجيع التعاون والعمل متعدد التخصصات؛بما في ذلك اللغات وراء اللغة الإنجليزية.نحن نفكر في التحديات التي واجهناها، مثل صعوبة تدريس مهارات البرمجة إلى جانب أساسيات NLP، ومناقشة المناطق للنمو في المستقبل.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعد ظاهرة التداخل الكهرطيسي في العصر الحالي ظاهرة هامة من الناحية الفيزيائية و الهندسية, و تشكل عاملاً أساسياً في تدني أداء الأجهزة الكهربائية و الإلكترونية. تتسبب الإنبعاثات الكهرطيسية المرافقة لأداء التجهيزات المذكورة في إحداث تغييرات في البيئة ال كهرطيسية المحيطة, و ما ينتج من تأثيرات في هذه البيئة و ما فيها من تجهيزات و نظم و مواد مختلفة. تتمثل مشاكل التداخل الكهرطيسي في تشابكه مع الأجهزة و النظم الإلكترونية و الكهربائية ما قد يؤدي إلى تخفيض مستوى أدائها لوظائفها المصممة من أجلها و فعالية هذا الأداء, و قد يصل ذلك إلى حد العجز عن قيامها بذلك, و نشير إلى أن هذه المشاكل تشكل في الوقت الراهن مسألة هامة و محوراً للأبحاث العلمية. تناول هذا البحث ظاهرة التداخل الكهرطيسي التي تحدث بين الأجهزة المختلفة, و ذلك باستخدام تقنيات الكهرطيسية الحسابية و بمساعدة برمجيات مناسبة توفر إمكانية نمذجة مسائل التداخل و متابعته حيزياً في الزمن الحي على المستوى المكروي الدقيق الذي تعجز عنه نظم الاختبار و أجهزة القياس المستخدمة.
ذهب مجال نفوذ NLP إلى ما بعد أبحاث علوم الكمبيوتر وتطوير تطبيقات البرمجيات في العقد الماضي.نرى أشخاصا يستخدمون أساليب NLP في مجموعة من التخصصات الأكاديمية من الدراسات الآسيوية إلى علم الأورام السريرية.نلاحظ أيضا وجود NLP كوحدة في معظم مناهج علوم البي انات داخل وخارج الإعدادات الجامعية العادية.تؤخذ هذه الدورات من قبل الطلاب من خلفيات متنوعة للغاية.تأخذ هذه الورقة نظرة فاحصة في بعض القضايا المتعلقة بتدريس NLP لهذه الجماهير المتنوعة بناء على تجارب الفصول الدراسية بناء على تجارب الفصول الدراسية، وتحدد بعض التحديات التي يواجهها المدربون، خاصة عندما لا يكون هناك نظام بيئي لدورات ذات صلة للطلاب.في هذه العملية، فإنه يحدد أيضا بعض مناطق التحدي لكل من الباحثين NLP ومطوري الأدوات.
العثور على سنة الكتابة لنص تاريخي له أهمية حاسمة للبحث التاريخي.ومع ذلك، نادرا ما يتم ذكر السنة الإبداعية الأصلية بشكل صريح ويجب استنتاجها من المحتوى النصي والسجلات التاريخية والقرائن الترفيزية.بالنظر إلى نص مكبس، فقد تم استخدام تعلم الجهاز بنجاح لتق دير سنة الإنتاج.في هذه الورقة، نقدم نظرة عامة على عدة طرق تقدير لمحفوظات النص التاريخية التي تمتد من القرن الثاني عشر حتى اليوم.
حاليا، تتلقى الترجمة متعددة اللغات الآلية أكثر اهتماما أكثر وأكثر لأنها تجلب أداء أفضل لغات الموارد المنخفضة (LRLS) وتوفر مساحة أكبر. ومع ذلك، فإن نماذج الترجمة متعددة اللغات الحالية تواجه تحديا شديدا: عدم التوازن. نتيجة لذلك، فإن أداء الترجمة من لغا ت مختلفة في نماذج الترجمة متعددة اللغات مختلفة تماما. نقول أن مشكلة الاختلال هذه تنبع من كفاءات التعليم المختلفة لغات مختلفة. لذلك، نحن نركز على تحقيق التوازن بين الكفاءات التعليمية لغات مختلفة واقتراح مناهج التعلم القائم على الكفاءة للترجمة الآلية متعددة اللغات، والتي تسمى CCL-M. على وجه التحديد، نقوم أولا بتحديد كفاءتين للمساعدة في جدولة لغات الموارد العالية (HRLS) ولغات المورد المنخفضة: 1) الكفاءة التي تم تقييمها ذاتيا، وتقييم مدى تعلم اللغة نفسها؛ 2) الكفاءة التي تم تقييمها HRLS، وتقييم ما إذا كانت LRL جاهزة للتعلم وفقا لخلاف HRLS الذي تم تقييمه الذاتي. استنادا إلى الكفاءات المذكورة أعلاه، نستخدم خوارزمية CCL-M المقترحة إضافة لغات جديدة تدريجيا في التدريب المحدد بطريقة تعلم المناهج الدراسية. علاوة على ذلك، نقترح استراتيجية أخذان رصاصة ديناميكية متوازنة من الكفاءة النووية لتحسين عينات التدريب بشكل أفضل في التدريب متعدد اللغات. تظهر النتائج التجريبية أن نهجنا حقق مكاسب أداء ثابتة وهامة مقارنة بالنهج السابق للدولة السابقة بشأن مجموعة بيانات محادثات تيد.
وقد وجدت الأعمال الحديثة دليلا على التحيز بين الجنسين في نماذج من الترجمة الآلية ودقة Aquerence باستخدام مجموعات بيانات التشخيص الاصطناعية في الغالب. في حين أن هذه التحيز الكمي في تجربة خاضعة للرقابة، فإنها غالبا ما تفعل ذلك على نطاق صغير وتتكون في م عظمها من الجمل الاصطناعية، خارج التوزيع. في هذا العمل، نجد أنماط نحوية تشير إلى مهام الدورانية النمطية وغير النمطية (مثل الممرضات الإناث مقابل الراقصين الذكور) في كوربورا من ثلاثة مجالات، مما أدى إلى أول مجموعة بيانات BIAS الجنسية على نطاق واسع من 108 ألفا جمل. نحن نتحقق يدويا من جودة Corpus الخاصة بنا واستخدامها لتقييم التحيز بين الجنسين في نماذج تحليل الأسلحة الأساسية المختلفة ونماذج الترجمة الآلية. نجد أن جميع النماذج المختبرة تميل إلى الإفراط في الاعتماد على الصور النمطية الجنسانية عند تقديمها مع المدخلات الطبيعية، والتي قد تكون ضارة بشكل خاص عند نشرها في النظم التجارية. أخيرا، نظيرنا على أن مجموعة بياناتنا تضفي نفسها على نموذج دقة COMEARCASE، ويجد أن يجدد التحيز على مجموعة مشغولة. تتوفر DataSet ونماذجنا علنا ​​في Github.com/slab-nlp/bug. نأمل أن يحفزون البحوث المستقبلية في تقنيات تخفيف تقييم التقييم بين الجنسين في الإعدادات الواقعية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا