ارتفع الأداء القياسي لتحليل الدلالي عبر قاعدة البيانات بشكل مطرد في السنوات الأخيرة، وحفزه باعتماد النماذج اللغوية المدربة مسبقا.ومع ذلك، فقد أظهر العمل الحالي أن المحاورين الدلاليين في قاعدة البيانات عبر الإنترنت يكافحون للتعميم إلى كلمات المستخدمين، وقواعد البيانات وهياكل الاستعلام.للحصول على تفاصيل شفافة حول نقاط القوة والحد من هذه النماذج، نقترح نهج اختبار تشخيصي يعتمد على توليفات التحكم في اللغة الطبيعية الكنسية وأزواج SQL.مستوحاة من قائمة المراجعة، فإننا نميز مجموعة من القدرات الأساسية لنماذج تحليل الدلالية عبر قاعدة البيانات، وتفصيل الطريقة لتوليف بيانات الاختبار المقابلة.قمنا بتقييم مجموعة متنوعة من النماذج عالية الأداء باستخدام النهج المقترح، وحددت العديد من نقاط الضعف غير الواضحة عبر النماذج (E.G. غير قادر على تحديد العديد من الأعمدة بشكل صحيح).يتم إصدار بيانات DataSet و Code كجناح اختبار على http://github.com/hclent/behaviorchecksempar.
The benchmark performance of cross-database semantic parsing has climbed steadily in recent years, catalyzed by the wide adoption of pre-trained language models. Yet existing work have shown that state-of-the-art cross-database semantic parsers struggle to generalize to novel user utterances, databases and query structures. To obtain transparent details on the strengths and limitation of these models, we propose a diagnostic testing approach based on controlled synthesis of canonical natural language and SQL pairs. Inspired by the CheckList, we characterize a set of essential capabilities for cross-database semantic parsing models, and detailed the method for synthesizing the corresponding test data. We evaluated a variety of high performing models using the proposed approach, and identified several non-obvious weaknesses across models (e.g. unable to correctly select many columns). Our dataset and code are released as a test suite at http://github.com/hclent/BehaviorCheckingSemPar.
المراجع المستخدمة
https://aclanthology.org/
نستكشف استخدام نماذج لغة كبيرة مسببة الاحتراج كحلل دلالي أقل بالرصاص.الهدف في التحليل الدلالي هو توليد تمثيل معنى منظم بالنظر إلى إدخال لغة طبيعية.ومع ذلك، يتم تدريب نماذج اللغة لتوليد اللغة الطبيعية.لسد الفجوة، نستخدم نماذج اللغة لإعادة صياغة المدخل
يمكن أن تكون أنظمة NLP المستندة إلى التعلم العميق حساسة للرموز غير المرئية ويصعب التعلم مع المدخلات عالية الأبعاد التي تعيق التعلم بشكل خطير.نقدم نهجا من خلال تجميع كلمات الإدخال على أساس التنوع الدلالي الخاص بهم لتبسيط تمثيل لغة الإدخال مع غموض منخف
في حين أن تقنيات التبغيات المتبقية تجد نجاحا متزايدا في مجموعة واسعة من مهام معالجة اللغة الطبيعية، فإن تطبيقها على الدورات الدلالية (SRL) كان محدودا بقوة من خلال حقيقة أن كل لغة تعتمد شكليها اللغوي الخاص بها، من Propbank من أجل أنظمة إنجليكزي للإسبا
على الرغم من نجاحهم، فإن نماذج اللغة الحديثة هشة.حتى التغييرات الصغيرة في خط أنابيب التدريب يمكن أن تؤدي إلى نتائج غير متوقعة.ندرس هذه الظاهرة من خلال فحص متانة ألبرت (LAN et al.، 2020) بالاشتراك مع متوسط وزن الأسكاستك (SWA) --- طريقة رخيصة للكمية --
يهدف هذا البحث إلى اختبار الصيغة الضعيفة للكفاءة في أسواق دمشق ،
عمان ، مسقط للأوراق المالية ، و لأجل تحقيق هذا الهدف فقد تم تطبيق كل من اختبار
التوزيع الطبيعي ، و اختبار التكرارات ، اختبار الارتباط المتسلسل ، اختبار جذر الوحدة ،
اختبار نسبة التبا