النماذج العصبية تتفوق في استخراج الأنماط الإحصائية من كميات كبيرة من البيانات، ولكن الكفاح لتعلم أنماط أو سبب حول اللغة من بعض الأمثلة فقط.في هذه الورقة، نسأل: هل يمكننا أن نتعلم قواعد واضحة تعميم بئر من بعض الأمثلة فقط؟نستكشف هذا السؤال باستخدام تخليق البرنامج.نقوم بتطوير نموذج توليف لتعلم قواعد علم الأصوات كبرامج في لغة خاصة بالمجال.نحن نختبر قدرة نماذجنا على التعميم من بعض الأمثلة التدريبية باستخدام مجموعة بياناتنا الجديدة من مشاكل اللغويات أولمبياد، وهي مجموعة صعبة من المهام التي تتطلب قدرة التفكير اللغوي القوي.بالإضافة إلى كونها كفاءة عالية، فإن نهجنا يولد برامج قابلة للقراءة البشرية، وتسمح بالتحكم في تعميم البرامج المستفادة.
Neural models excel at extracting statistical patterns from large amounts of data, but struggle to learn patterns or reason about language from only a few examples. In this paper, we ask: Can we learn explicit rules that generalize well from only a few examples? We explore this question using program synthesis. We develop a synthesis model to learn phonology rules as programs in a domain-specific language. We test the ability of our models to generalize from few training examples using our new dataset of problems from the Linguistics Olympiad, a challenging set of tasks that require strong linguistic reasoning ability. In addition to being highly sample-efficient, our approach generates human-readable programs, and allows control over the generalizability of the learnt programs.
المراجع المستخدمة
https://aclanthology.org/
من المعروف أن نماذج الحوار العصبي تعاني من مشاكل مثل توليد ردود غير آمنة وغير متناسقة.على الرغم من أن هذه المشاكل حاسمة وسائدة، إلا أنها تعد في الغالب يدويا من قبل مصممي النماذج من خلال التفاعلات.في الآونة الأخيرة، يرشد بعض الأبحاث أن الجماعات الجمهو
شاركنا في جميع المسارات لمهمة الترجمة الآلية ل WMT 2021: وحدة المعالجة المركزية ذات CPU أحادية النواة، وحدة المعالجة المركزية متعددة النواة، وأجهزة GPU مع شروط الإنتاجية والكمولية.تجمع تقاريرنا العديد من استراتيجيات الكفاءة: تقطير المعرفة، وحدة فك تر
اليوم، تتضمن المؤسسات الإعلامية الأخبار بانتظام مع القراء من خلال تمكينهم من التعليق على المقالات الإخبارية.هذا يخلق الحاجة إلى التعليق الاعتدال وإزالة التعليقات غير المسموح بها - وهي مهمة تستغرق وقتا طويلا في كثير من الأحيان أداءها المشرفين البشري.ف
يحقق هذا العمل في قيمة زيادة الشبكات العصبية المتكررة مع هندسة ميزة لهندسة الطلب العربي الثاني (NADI) 1.2: تحديد المستوى القطري.نقارن أداء LSTM على مستوى الكلمات البسيطة باستخدام Artrained Abbeddings مع واحدة معززة باستخدام ميزة الميزات للميزات اللغو
ينقل الناس نيتهم وموقفهم من خلال الأساليب اللغوية للنص الذي يكتبونه. في هذه الدراسة، نقوم بتحقيق كملات المعجم في المعجم عبر الأساليب طوال العدسين: الإدراك البشري وأهمية كلمة الجهاز، لأن الكلمات تختلف في قوة الإشارات الأسلوبية التي تقدمها. لجمع ملصق