ترغب بنشر مسار تعليمي؟ اضغط هنا

نتعامل مع مشكلة شبكات التدريب الذاتي ل NLU في بيئة الموارد المنخفضة --- عدد قليل من البيانات المسمى والكثير من البيانات غير المسماة. إن فعالية التدريب الذاتي هي نتيجة لزيادة مقدار البيانات التدريبية أثناء التدريب. ومع ذلك، يصبح أقل فعالية في إعدادات الموارد المنخفضة بسبب الملصقات غير الموثوقة المتوقعة بواسطة نموذج المعلم على البيانات غير المسبقة. تم استخدام قواعد القواعد، التي تصف الهيكل النحوي للبيانات، في NLU للحصول على شرح أفضل. نقترح استخدام قواعد القواعد في التدريب الذاتي كآلية وضع العلامات الزائفة أكثر موثوقية، خاصة عندما يكون هناك عدد قليل من البيانات المسمى. نقوم بتصميم خوارزمية فعالة تقوم ببناء وتوسيع قواعد قواعد اللغة دون تورط بشري. ثم ندمج القواعد المبنية كآلية وضع العلامات الزائفة في التدريب الذاتي. هناك سيناريوهات محتملة فيما يتعلق بتوزيع البيانات: غير معروف أو معروف في التدريب قبل التدريب. إننا نوضح تجريبيا أن نهجنا يتفوق بشكل كبير على الأساليب الحديثة في ثلاث مجموعات بيانات معيار لكل من السيناريوهات.
يعد تعلم الفروق المحتمات الدقيقة بين العناصر المفردات تحديا رئيسيا في تعلم لغة جديدة.على سبيل المثال، يحتوي جدار الاسم "على مظاهر معجمية مختلفة باللغة الإسبانية - قلص" "يشير إلى جدار داخلي بينما يشير مورو" إلى جدار خارجي.ومع ذلك، قد لا يكون هذا التنو ع من التمييز المعجمي واضحا للمتعلمين غير الأصليين ما لم يتم تفسير التمييز بهذه الطريقة.في هذا العمل، نقدم طريقة لتحديد التفرقات المعجمية المحتلة تلقائيا، واستخراج القواعد في توضيح هذه الفروق بتنسيق قابل للقراءة بين الإنسان والآلات.نحن نؤكد جودة هذه القواعد المستخرجة في إعداد تعلم اللغة لغتين وإسبانيا واليونانيين، حيث نستخدم القواعد لتدريس الناطقين غير الأصلية عند ترجمة كلمة غامضة معينة في ترجماتها المختلفة المحتملة.
غالبا ما يتم الحصول على بيانات التدريب للترجمة الآلية (MT) من العديد من الشركات الكبيرة التي هي متعددة الأوجه في الطبيعة، على سبيل المثالتحتوي على محتويات من مجالات متعددة أو مستويات مختلفة من الجودة أو التعقيد.بطبيعة الحال، لا تحدث هذه الجوانب بتردد متساو ولا هي نفسها نفسها بنفس القدر لسيناريو الاختبار في متناول اليد.في هذا العمل، نقترح تحسين هذا التوازن بشكل مشترك مع معلمات نموذج MT لتخفيف مطوري النظام من تصميم الجدول اليدوي.يتم تدريب عصري متعدد المسلح على الاختيار ديناميكيا بين الجوانب بطريقة مفيدة لنظام MT.نقيمها على ثلاثة تطبيقات مختلفة متعددة الأوجه: موازنة البيانات النسبية والبيانات التدريبية الطبيعية، أو البيانات من مجالات متعددة أو أزواج متعددة اللغات.نجد أن تعلم الفرعيد يؤدي إلى أنظمة MT تنافسية عبر المهام، ويقدم تحليلنا رؤى في استراتيجياته المستفادة ومجموعات البيانات الأساسية.
استخراج العلاقات على مستوى المستند يهدف إلى تحديد العلاقات بين الكيانات في وثيقة كاملة. اعتمدت الجهود السابقة لالتقاط التبعيات البعيدة المدى اعتمادا كبيرا على تمثيلات قوية ضمنيا تعلمت من خلال (الرسم البياني) الشبكات العصبية، مما يجعل النموذج أقل شفاف ية. لمعالجة هذا التحدي، في هذه الورقة، نقترح Logire، نموذج احتمالي رواية لاستخراج العلاقة على مستوى المستند من خلال قواعد المنطق التعلم. يعامل Logire القواعد المنطقية مثل المتغيرات الكامنة وتتكون من وحدات اثنين: مولد القاعدة واستخراج العلاقة. إن مولد القاعدة هو توليد قواعد المنطق التي يحتمل أن تسهم في التنبؤات النهائية، ونضول النازع العلاقة تنبؤات نهائية بناء على قواعد المنطق التي تم إنشاؤها. يمكن تحسين هاتين الوحداتتين بكفاءة مع خوارزمية التوقعات (EM). من خلال إدخال القواعد المنطقية في الشبكات العصبية، يمكن ل Rogire أن تلتقط الصريح التبعيات طويلة المدى وكذلك الاستمتاع بتفسير أفضل. تظهر النتائج التجريبية أن تتفوق بشكل كبير على العديد من خطوط الأساس القوية من حيث الأداء العلاقة والاتساق المنطقي. يتوفر الكود الخاص بنا في https://github.com/rudongyu/logire.
نقدم Inferbert، وهي طريقة لتعزيز نماذج الاستدلال القائمة على المحولات مع المعرفة العلائقية ذات الصلة. يسهل نهجنا تعلم أنماط الاستدلال العامة التي تتطلب معرفة علوية (على سبيل المثال الاستدلالات المتعلقة بفرط النعطح) أثناء التدريب، مع حقنها عند الطلب ا لحقائق العلائقية ذات الصلة (E.G. Pangolin هي حيوان) في وقت الاختبار. نطبق Inferbert بمهمة NLI على مجموعة متنوعة من أنواع الاستدلال (ارتفاع ضغط الدم، الموقع، اللون، وبلد بلد المنشأ)، التي جمعنا مجموعات بيانات التحدي. في هذا الإعداد، ينجح Inferbert في تعلم أنماط الاستدلال العام، من عدد صغير نسبيا من مثيلات التدريب، مع عدم إظليل الأداء على بيانات NLI الأصلية وتفوق نماذج تحسين المعرفة السابقة بشكل كبير على بيانات التحدي. وينطبق كذلك استنتاجاتها بنجاح في وقت اختبار الكيانات غير المفككة سابقا. Inferbert هو أكثر كفاءة على حسابي أكثر كفاءة من معظم الطرق السابقة، من حيث عدد المعلمات واستهلاك الذاكرة وتدريب الوقت.
تشرح هذه الورقة تصميم نظام غير متجانس في المرتبة الثامنة في المنافسة في مهمة Semeval2021 8. نقوم بتحليل تجارب الأزمة وإظهار كيفية تأثير مكونات النظام، وهي المراكز الملاقة، معرف الوحدة، مصنف المعدل ونموذج اللغة، على النتيجة الإجمالية.قارنا نتائجنا إلى تجارب مماثلة من الأدب وأدخل خوارزمية تجمع تطورت في مرحلة ما بعد التقييم التي زادت النتيجة الإجمالية لنظام نظامنا، مرفقة بفرضية مرتبة المنافسة من ثمانية إلى ستة.
يعرض هذا البحث دراسة مرجعية حول استخدام تقنيات الذكاء الصنعي والتنقيب عن المعطيات في أنظمة مكافحة غسيل الأموال. نقارن بين عدة منهجيات متبعة في أوراق بحثية مختلفة بهدف تسليط الضوء على تطبيقات الذكاء الصنعي في حل مشاكل الحياة الواقعية.
إن موضوع الدراسة في هذا البحث يعد من المواضيع الهامة في نظرية الأعداد, حيث تطرقنا إلى العديد من التقنيات و الأنظمة التي لها صلة بمعادلات ديوفانتس.
يَبْقَى ضَبْطُ الْمَعْنَى وَ الْوُصُوْلُ إِلَيْهِ غاية كُلِّ بَاْحِثٍ فِي اللُّغَةِ، وَ مَاْ دَاْمَ الْمَعْنَى هُوَ نِتَاْج التَّرْكِيْبِ النَّحْوِيِّ فِيْ مَقَاْمٍ مُعَيَّنٍ، لَاْ بُدَّ لِذَلِكَ الْبَاْحِثِ أَلَّا يُقْصِيَ أَحَدَهُمَاْ عَلَى حِسَاْب ِ الْآخَرِ؛ أَيْ: تَدْخُلُ كُلٌّ مِنَ الْعَنَاْصِرِ النَّحْوِيَّةِ وَ الْعَنَاْصِرِ الدِّلَاْلِيَّةِ فِي عَلَاْقَةٍ جَدَلِيَّةٍ فِي تَفْسِيْرِ الْمَعْنَى. وَ مِنْ هُنَاْ تَنَاْوَلْتُ فِي هَذَا الْبَحْثِ مَفْهُوْمَ مُقْتَضَى الْحَاْلِ وَ الْمُصْطَلَحَاْتِ الْمُتَعَلِّقَة بِهِ، وَ بَيَاْنَ فَاْعِلِيَّتِهِ فِي الْحَقْلِ اللُّغَوِيِّ، وَ أَثَرَ الْعَاْمِلِ الدِّيْنِيِّ فِيْ لَفْتِ أَنْظَاْرِ الْعُلَمَاْءِ الْقُدَاْمَى إِلَى أَهَمِّيَّةِ كُلٍّ مِنَ الشَّكْلِ النَّحْوِيِّ وَ الْمَقَاْمِ الَّذِيْ أَنْتَجَهُ، وَ مَدَى اعْتِمَاْدِ عُلَمَاْئِنَا الْقُدَاْمَى عَلَيْهِمَاْ وَ هُمْ يُفَسِّرُوْنَ النُّصُوْصَ الْقُرْآنِيَّةَ وَ الشَّوَاْهِدَ الشِّعْرِيَّةَ وَ يَسْتَخْرِجُوْنَ الْقَواْعِدَ مِنْهَاْ.
قواعد الارتباط هي حقل هام في التنقيب عن البيانات، و الذي يُستخدم لاكتشاف معرفة مفيدة من قواعد بيانات ضخمة. و تُستخدم قواعد الارتباط لاستخلاص معلومات من صفقات قواعد البيانات. و خوارزمية الأسبقية هي التطبيق العملي لقواعد الارتباط، و بدورها تُستخدم ل إيجاد مجموعات من البيانات المتكررة في صفقات قواعد البيانات. نقدّم في هذا البحث تحسيناً جديداً لخوارزمية الأسبقية بتخفيض توليد مجموعات بنود البيانات المُرشّحة مما يؤدي إلى زيادة فعّالية خوارزمية الأسبقية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا