ترغب بنشر مسار تعليمي؟ اضغط هنا

إن فهم كيفية ترميز الهيكل اللغوي في التضمين السياق يمكن أن يساعد في تفسير أدائه المثير للإعجاب عبر NLP.عادة ما تدعو النهج الحالية لتحقيقها عادة إلى تدريب الطبقات وتستخدم الدقة والمعلومات المتبادلة أو التعقيد كوكيل لخير التمثيل.في هذا العمل، نجادل بأن القيام بذلك يمكن أن يكون غير موثوق به لأن تمثيلات مختلفة قد تحتاج إلى طبقات مختلفة.نقوم بتطوير إرشادي، DirectProbe، يدرس مباشرة هندسة التمثيل من خلال البناء عند فكرة مساحة الإصدار لمهمة.تبين التجارب التي لديها العديد من المهام اللغوية والموظفة السياقية أنه، حتى بدون منصوص قياسات التدريب، يمكن أن يضيء DirectProbe الأنوار حول كيفية تمثيل مساحة التضمين ملصقات وتوقع أيضا أداء المصنف للتمثيل أيضا.
في هذه الورقة، نقدم مصنف صاعقة صعبة عصرية عربية (MSA) الحديثة، والذي يتوقع صعوبة الجمل المتعلمين في اللغة باستخدام مستويات الكفاءة CEFR أو التصنيف الثنائي بصورة بسيطة أو معقدة.نحن نقارن استخدام تضمين الجملة من أنواع مختلفة (fastlext، mbert، xlm-r وال عربية-bert)، وكذلك ميزات اللغة التقليدية مثل علامات نقاط البيع وأشجار التبعية وعشرات قابلية القراءة وقوائم التردد لمتعلمي اللغة.تم تحقيق أفضل النتائج لدينا باستخدام Brited Berted Berted Bert.دقة تصنيف CEFR الخاص بنا ثلاثي الاتجاه هو F-1 من 0.80 و 0.75 للتصنيف باللغة العربية-Bert و XLM-R على التوالي و 0.71 ارتباط سبيرمان للانحدار.يصل مصنف صعوبةنا الثنائية إلى F-1 0.94 و F-1 0.98 للقراءة الدلالية للقرن.
أصبح على الإنترنت على الإنترنت مصدر قلق متزايد للنساء العربيات الذين يعانون من سوء المعاملة على الإنترنت على أساس الجنس على أساس يومي. يمكن أن تساعد أنظمة الكشف الأوتوماتيكية في كراثيلي في حظر المحتوى السام العربي للمرأة. يتم إعاقة تطوير هذه النظم من خلال عدم وجود مجموعات البيانات العربية القياسية. في هذه الورقة، نقدم مجموعة بيانات Twitter العربية ل Leavantine للغة الكهثرية (LET-MI) ليكون أول مجموعة بيانات معيار للكريساني. نوفر كذلك مراجعة تفصيلية لخلق البيانات ومراحل التوضيحية. تم التأكيد على اتساق التوضيحية الخاصة ب DataSet المقترحة من خلال تدابير تقييم الاتفاقية بين الخصوصية. علاوة على ذلك، تم استخدام دعونا كمادة بيانات تقييم من خلال مهام التصنيف الثنائية / متعددة المستهدفة التي أجرتها العديد من أنظمة تعلم الآلات ذات الجهاز من خلال تكوين التعلم المتعدد المهام (MTL). أشارت النتائج التي تم الحصول عليها إلى أن العروض التي حققتها النظم المستخدمة تتسق مع النتائج الحديثة لغات أخرى غير اللغة العربية، أثناء توظيف MTL تحسن أداء مهام التصنيف الكبرى / الهدف.
توفر منصات الوسائط الاجتماعية (SM) مثل Twitter كميات كبيرة من البيانات في الوقت الفعلي والتي يمكن الاستفادة منها أثناء حالات الطوارئ الجماعية. تتطلب تطوير أدوات لدعم المجتمعات المتأثرة بالأزمات مجموعات البيانات المتاحة، والتي غالبا ما تكون موجودة لغا ت الموارد المنخفضة. تقدم هذه الورقة Kawarith A Corpus عربي لهي تيتر من أجل أحداث الأزمات، تضم أكثر من مليون تغريدات عربية تم جمعها خلال 22 أزمات حدثت بين عامي 2018 و 2020 وشمل عدة أنواع من الخطر. كشف استكشاف هذا المحتوى عن أهم المواضيع وأنواع المعلومات، وتقدم الورقة مجموعة بيانات معدنية من سبعة أحداث طارئة تعمل كمعيار ذهبي للعديد من المهام في أبحاث المعلوماتية للأزمات. استخدام البيانات المشروحة من نفس الحدث، يكون نموذج BERT يتم ضبطه جيدا لتصنيف تغريدات إلى فئات مختلفة في الإعداد متعدد الملصقات. تظهر النتائج أن النماذج القائمة على بيرت تسفر عن أداء جيد في هذه المهمة حتى مع كميات صغيرة من بيانات التدريب الخاصة بمهام المهام.
يحقق هذا العمل في قيمة زيادة الشبكات العصبية المتكررة مع هندسة ميزة لهندسة الطلب العربي الثاني (NADI) 1.2: تحديد المستوى القطري.نقارن أداء LSTM على مستوى الكلمات البسيطة باستخدام Artrained Abbeddings مع واحدة معززة باستخدام ميزة الميزات للميزات اللغو ية المهندسة.تظهر نتائجنا أن إضافة ميزات صريحة إلى LSTM ضارية للأداء.نحن نعزو هذا فقدان الأداء على التبريد في بعض العناصر اللغوية في بعض النصوص، وكلية المواضيع، والتنقل المشارك.
يتزايد استخدام التعرف على الكيان المسمى (NER) على النصوص العربية القديمة بشكل مطرد.ومع ذلك، فقد تم تطوير معظم الأدوات لإرجاع اللغة الإنجليزية الحديثة أو تدربت على وثائق اللغة الإنجليزية وهي محدودة للنص العربي التاريخي.حتى أدوات NER العربية غالبا ما ت درب على نص حديث من مصادر الويب، مما يجعل مناسبا له بمهمة تاريخية مشكوك فيها.لتخفيف ندرة الموارد العربية السعودية العربية، نقترح نموذج فرقة ديناميكية باستخدام العديد من المتعلمين.يتم تحقيق الجانب الديناميكي من خلال الاستفادة من التنبؤ والميزات على نتائج خوارزمية NER التي حددت التي أجريت بشكل أفضل على مهمة محددة في الوقت الفعلي.نقوم بتقييم نهجنا ضد أحدث أساليب النيران العربية والثابتة من أساليب الفرقة الثابتة عبر مهمة تاريخية تاريخية جديدة التي أنشأناها.تظهر نتائجنا أن نهجنا يحسن على أحدث ويودر من 0.8 درجة مئوية بشأن هذه المهمة الصعبة.
نقدم الأزواج، أول مجموعة بيانات عربية كبيرة من المطالبات التي تحدث بشكل طبيعي تم جمعها من 5 مواقع عربية للتحقق من الحقائق، على سبيل المثال، فات بايانو ومطبقة، وتغطي المطالبات التي تغطيها منذ عام 2016. تتكون DataSet لدينا من 6،121 مطالبة جنبا إلى جنب مع ملصقاتها الواقعية والبيانات الوصفية الإضافية، مثلمع تحديد محتوى المقال عن الواقع، فئة موضحة، وروابط للمشاركات أو صفحات الويب نشر المطالبة.نظرا لأن البيانات يتم الحصول عليها من مختلف مواقع التحقق من الحقائق، فإننا نقوم بتوحيد ملصقات المطالبة الأصلية لتوفير تصنيف ملصقات موحدة لجميع المطالبات.علاوة على ذلك، نحن نقدم إحصاءات البيانات الكاشفة وتحفيز استخدامها من خلال اقتراح تطبيقات بحثية محتملة.يتم توفير مجموعة البيانات للجمهور لمجتمع البحث.
الهوية واللغة القياسية الهوية هي مهام حاسمة للعديد من تطبيقات معالجة اللغة العربية.في هذه الورقة، نقدم نظامنا القائم على التعلم العميق، المقدم إلى المهمة المشتركة الثانية من النادي الثاني لتحديد المستوى القطري على مستوى المحافظة على اللغة العربية الم عيارية الحديثة (MSA) واللهولية العربية (DA).يعتمد النظام على نموذج تعليمي عميق متعدد الإنهائي (MTL) لمعالجة كلا من الرتبة البلد والمستوى من المستوى MSA / DA.يتكون نموذج MTL الأخير من محولات تمثيل ترميز ترميز مشترك (بيرت)، طبقات اهتمام خاصتين بمهام العمل، واثنين من المصنفين.تتمثل فكرتنا الرئيسية في الاستفادة من كل من التمييز على المهمة والميزات المشتركة بين المهام للبلد والمقاطعة MSA / DA الهوية.تظهر النتائج التي تم الحصول عليها أن نموذج MTL يتفوق على نماذج مهمة واحدة في معظم المهام الفرعية.
هذا البحث محاولة لدراسة رمزية الإنسان في مذهب ابن عربي, فقد كان يرى أن العالم قائم على الرمز, حيث وجدنا أن الإنسان هو الرمز الأكثر أهمية عنده, فكان يشابه بين الله و الإنسان, و بين الإنسان و العالم, إذ كان العالم عنده إنسان كبير, و الإنسان هو رمز و مفتاح هذا العالم من جهة, و معرفة الحق من جهة أخرى.
شغل أدب الرحلة مكاًنا مميزا في أدبنا العربي لما يتصف به من جمع بين الفائدة و المتعة، و رحلة العبدري نموذج من الآثار الأدبية التي وصلت إلينا من التراث الأدبي الأندلسي و المغربي، و عملٌ فريد استطاع صاحبه (العبدري) أن يقدم فيه صورًة متكاملة واضحة الم عالم لجميع مظاهر النشاط العلمي في كلّ بقعة وطأتها قدماه في المشرق و المغرب، و جعل من رحلته مرآًة صافية عكست ثقافته، و سعة اطلاعه، و ملكته الأدبية، و موهبته الشعرية. فهذه الرحلة وثيقة مهمة عن الحياة الثقافية في أواخر القرن السابع الهجري، إذ بدأها العبدري في سنة 688 ه و أنهاها في سنة 691 ه، فكانت مصدرا للأدباء و العلماء و المؤرخين لما ورد فيها من نصوصٍ أدبية، و نقدية، و مناظراتٍ علمية، و إشاراتٍ تاريخية، كما أن المرتحلين الذين جاؤوا بعد العبدري، نهلوا منها، و نقلوا عنها كابن .( بطوطة، وابن عبد السلام الناصري و غيرهما) 1 فالجانب العلمي فيها يستحق أن يلقى الضوء عليه، ليكون الدارسون و الباحثون على معرفة بهذا الأثر الأدبي الذي ضم بين دفتيه كثيرًا من ألوان المعرفة و الثقافة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا