ترغب بنشر مسار تعليمي؟ اضغط هنا

تظهر النماذج المسبقة للتدريب المستندة إلى المحولات مثل Bert و Electra حول مجموعة من كورسيا العربية، التي أظهرها كل من أرابيرت وأريكيكترا، نتيجة مثيرة للإعجاب في مهام المصب.ومع ذلك، فإن نماذج اللغة المستندة إلى المحولات قبل التدريب هي باهظة الثمن، خاص ة بالنسبة للنماذج الكبيرة.في الآونة الأخيرة، تناول محول القمع التكرار المتسلسل داخل بنية المحولات من خلال ضغط تسلسل الدول المخفية، مما يؤدي إلى انخفاض كبير في تكلفة ما قبل التدريب.تدرس هذه الورقة تجريبية أداء وكفاءة بناء نموذج اللغة العربية مع محول القمع وهناك هدف Electra.نجد أن نموذجنا يحقق نتائج أحدث النتائج على العديد من المهام المصب العربية على الرغم من استخدام موارد حسابية أقل مقارنة بالنماذج الأخرى القائمة على بيرت.
مكنت التقدم في تمثيل اللغة الإنجليزية مهمة أكثر كفاءة عينة من خلال التعلم بكفاءة ترميز يصنف بدائل الرمز المميز بدقة (Electra).أي، بدلا من تدريب نموذج لاستعادة الرموز الممثيلين، يقوم بتدريب نموذج تمييزي على التمييز بين الرموز الإدخال الحقيقية من الرمو ز التالفة التي تم استبدالها بشبكة مولدات.من ناحية أخرى، فإن نهج تمثيل اللغة باللغة العربية الحالية تعتمد فقط على الاحتجاج عن طريق نمذجة اللغة الملثم.في هذه الورقة، نقوم بتطوير نموذج تمثيل اللغة باللغة العربية، والتي نستها ARAELECTRA.يتم الاحترام من النموذج الخاص بنا باستخدام هدف الكشف عن الرمز المميز في النص العربي الكبير.نقوم بتقييم نموذجنا على مهام NLP العربية المتعددة، بما في ذلك فهم القراءة وتحليل المعرفات والاعتراف باسم الكيان المسمى ونعرض أن ARAELECTRA تتفوق على نماذج تمثيل اللغة العربية الحديثة الحالية، بالنظر إلى نفس البيانات المحددةحجم نموذج أصغر.
تمكين السلوك التعرفي في وكلاء الحوار باللغة العربية هو جانب مهم في بناء نماذج المحادثة يشبه الإنسان. في حين أن معالجة اللغة العربية الطبيعية قد شهدت تطورات كبيرة في فهم اللغة الطبيعية (NLU) مع نماذج اللغة مثل أرابيرت، فإن توليد اللغة الطبيعية (NLG) ل ا تزال تحديا. تعد أوجه القصور النموذجية لنماذج فك تشفير NLG في المقام الأول إلى عدم وجود مجموعات البيانات العربية مناسبة لتدريب نماذج NLG مثل عوامل المحادثة. للتغلب على هذه المسألة، نقترح فك ترميز التركيب المستندة إلى المحولات مع معلمات أرابتير. من خلال تهيئة أوزان التشفير والكشف عن الأوزان المدربة مسبقا مسبقا، كان طرازنا قادرا على الاستفادة من نقل المعرفة وزيادة الأداء في توليد الاستجابة. لتمكين التعاطف في نموذج المحادثة لدينا، نربطها باستخدام مجموعة بيانات ArabithatheticTialogues وتحقيق الأداء العالي في توليد الاستجابة المتعاطفة. على وجه التحديد، حقق نموذجنا قيمة حيرة منخفضة تتراوح بين 17.0 وزيادة في 5 نقاط بلو مقارنة بالنموذج السابق للدولة السابقة. أيضا، تم تصنيف نموذجنا المقترح بشدة بنسبة 85 مقيم بشري، والتحقق من قادرته عالية في إظهار التعاطف مع توليد الاستجابات ذات الصلة والطلاقة في إعدادات المجال المفتوح.
ساعد ظهور نماذج التعلم المتعددة المهام (MTL) في السنوات الأخيرة دفع الشقيقة للفن في اللغة الطبيعية Un-derstanding (NLU). نعتقد بشدة أن مشاكل Thanmany NLU باللغة العربية يتم تصحيحها على جني فوائد هذه النماذج. تنتهي Tothis نقترح معيار التقييم باللغة ال عربية للأمم المتحدة (Alue)، بناء على 8 مهام مختارة بعناية و Lateded. لمدة خمسة من هؤلاء، نوفرو مجموعات من هذه البيانات الخاصة بتقييم القطاع الخاص للهناء من نزاهة وصلاحية معيارنا. كما نقدم مجموعة بيانات تشخيصية لتحقيق الأعمال الداخلية للبحث في الأعمال الداخلية لصالحهم. تجاربهم الأولية تظهر نماذج THOTMTL تتفوق على ThereCedCounterParts مهام. ولكن من أجل مشاركة EN-TICE من المجتمع الأوسع، نلتزم بالنشر المدربين أساسا أساسيا. ومع ذلك، فإن تحليلنا يكشف أن هذا هو الكثير من الغرفة للتحسين nlu inarabic. نأمل أن يتم تشغيل Alue جزءا في مساعدة مجتمعنا على تحقيق بعض هذه التحسينات. قام الباحثون المهتمون بدعوة إلى تقديم نتائجنا إلى المتصدرين لدينا عبر الإنترنت، ويمكن الوصول إليها علنا.
هدفت الدراسة الحالية إلى الكشف عن درجة ممارسة معلمي اللغة العربية لمهارات تنمية التفكير الإبداعي في مديرية التربية و التعليم لمنطقة البادية الشمالية الشرقية. و تكونت عينة الدراسة من (200) معلمًا و معلمة لغة عربية للصفين السادس و السابع الأساسيين. و ل تحقيق أهداف الدراسة، استخدم الباحث استبانة مكونة من (63) بندًا. كشفت نتائج الدراسة أنّ درجة ممارسة معلمي اللغة العربية لمهارات تنمية التفكير الإبداعي لدى طلبتهم كانت متوسطة على المجموع الكلي للأداة، و في مجالات: الحرية في التعبير، و الاتجاه الإيجابي نحو الإبداع، و طرق التدريس، و طرق التقويم، و البيئة الصفية، و تحفيز الإبداع. كما أشارت نتائج الدراسة إلى عدم وجود فروق ذات دلالة إحصائية في درجة ممارسة معلمي اللغة العربية في مديرية التربية و التعليم لمنطقة البادية الشمالية الشرقية لمهارات تنمية التفكير الإبداعي تبعًا لمتغير: الجنس، و الخبرة، و المؤهل العلمي على جميع مجالات الدراسة. و بناء على ذلك خلصت الدراسة إلى جملة من التوصيات ذات العلاقة
هدفت الدراسة إلى تعرف الأداء اللغوي لمعلمي اللغة العربية و علاقتها باتجاهاتهم نحو تدريس المادة، و تكونت عينة الدراسة من (40) معلماً و معلمة من معلمي و معلمات اللغة العربية في المدارس التابعة لمديرية التربية و التعليم لمنطقة البادية الشمالية الشرقية ف ي الاردن. و استُخدم المنهج الوصفي التحليلي، و جرى إعداد أداتين الأولى بطاقة ملاحظة، و الثانية مقياس اتجاهات نحو تدريس المادة. و أظهرت نتائج الدراسة أن الأداء اللغوي لمعلمي اللغة العربية بمستوى (متوسط)، و أن اتجاهات المعلمين نحو تدريس المادة جاءت بمستوى (متوسط) أيضاً و دل ذلك على وجود علاقة قوية بين الأداء اللغوي و الاتجاه نحو تدريس المادة.
هدفت هذه الدّراسة إلى تحليل مدى تضمين مناهج اللغة العربيّة في الأردن (من الأول و حتّى السّادس) الأداء اللغويّ المتمثّل في مهارات اللغة: الاستماع و المحادثة و القراءة و الكتابة وفقًا لنتاجات التّعليم المتمثلة في الأهداف؛ للوقوف على مدى مناسبة محتوى من اهج اللغة العربيّة للأهداف الّتي وضعت من أجلها. و قد أظهرت نتائج التّحليل الآتي: إنّ نسبة تمثيل المحتوى لمهارة الاستماع لجميع الصّفوف " 80.75% "، و نسبة تمثيل المحتوى لمهارة المحادثة لجميع الصّفوف " 84.3% "، و نسبة تمثيل المحتوى لمهارة الكتابة لجميع الصّفوف " %91.25 "، و نسبة تمثيل المحتوى لمهارة القراءة لجميع الصّفوف " 92.8% ". و أظهرت نتائج التّحليل على مستوى المنهاج ككل الآتي: إنّ نسبة تمثيل المحتوى لجميع المهارات في الصّف الأول"89.5% "، و إنّ نسبة تمثيل المحتوى لجميع المهارات في الصّف الثّاني"89.125% "، و إنّ نسبة تمثيل المحتوى لجميع المهارات في الصّف الثّالث "87.875%"، و إنّ نسبة تمثيل المحتوى لجميع المهارات فيالصّف الرّابع "87.375%"،و إنّ نسبة تمثيل المحتوى لجميع المهارات في الصّف الخامس "85.5%"، و إنّ نسبة تمثيل المحتوى لجميع المهارات في الصّف السّادس "84.375%". و خلصت الدّراسة بمجموعة من التّوصيات.
نقدم في هذا البحث خوارزمية لتجميع نصوص اللغة العربية. حيث نفذنا الخوارزمية على 5 أنطولوجيات عبر برنامج بلغة الجافا، ثم عالجنا النصوص بحيث حصلنا على 338667 مفردة مع أوزانها المقابلة لكل أنطولوجيا. و قد أثبتت الخوارزمية فعاليتها في تحسين أداء المصنفا ت التي تم تجربتها في هذه الدراسة و هي (NB,SVM) مقارنة مع نتائج مصنفات اللغة العربية السابقة.
يعد غياب التشكيل في النصوص العربية الحديثة من أكبر التحديات التي تواجه المعالجة الآلية للغة العربية. يمكن للقارئ العربي أن يتوقع التشكيل الصحيح للكلمات عند قراءته نصاً غير مشكول، في حين يحتاج الحاسوب إلى خوارزميات لاستعادة التشكيل بالاعتماد على معار ف مختلفة. و نقصد بالتشكيل الحركات جميعها (ضمة، فتحة، كسرة، سكون)، فضلاً عن الشدة و التنوين. تعتمد بعض منهجيات التشكيل الآلي على المعالجة اللغوية للنصوص، في حين تعتمد منهجيات أخرى على طرائق إحصائية تستند إلى المدونات، و تدمج بعض النظم المنهجيتين السابقتين في مقاربات هجينة. نعرض في هذا البحث دراسة مرجعية شاملة للطرائق المختلفة التي اعتُمدت في هذه المنهجيات، كما نستعرض المدونات المختلفة التي استُخدمت للاختبارات و التقويم، ثم نطرح مواصفات المدونات التي يجب إعدادها لإجرائيات التقويم، و المعايير التي يجب أن تحققها إجرائية تقويم المشكلات الآلية. يخلص البحث إلى وضع خطة عمل لبناء مشكل آلي مفتوح المصدر برعاية منظمة ألكسو، و بمشاركة جهات بحثية من بلدان مختلفة.
نعرض في هذه الورقة نظام معجم اللغة العربية الحاسوبي المطور في المعهد العالي للعلوم التطبيقية و التكنولوجيا. يتيح هذا النظام للمستخدِم البحث عبر الوب عن معاني المفردات، و يعرض خصائص كلِّ معنى، مع عددٍ من الأمثلةِ و بعض الوسائط المتعددة الموافقة، فضلاً عن معلومات أخرى تتعلَّق بالمفردة (كالكلمات المصاحبة، و المجالات الدلالية، و العبارات الاصطلاحية، و الفوائد اللغوية و الصرفية و النحوية و البلاغية، و الأخطاء الشائعة). كذلك يتيح المعجم للمستخدم الخبير المشاركة في عملية إغناء المعجم بالمفردات التي لم ترد ضمنه و المعاني الأخرى لمداخله الحالية و ما يتصل بهما من معلومات على المستويات الصرفية و النحوية و الدلالية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا