تلخيص شفرة المصدر الآلي هي موضوع أبحاث هندسة برامج شهيرة حيث يتم استخدام نماذج الترجمة الآلية لترجمة مقتطفات التعليمات البرمجية إلى أوصاف اللغة الطبيعية ذات الصلة. تتم معظم تقييمات هذه النماذج باستخدام مقاييس تلقائية قائمة على المرجع. ومع ذلك، بالنظر إلى الفجوة الدلالية الكبيرة نسبيا بين لغات البرمجة واللغة الطبيعية، فإننا نقول أن هذا الخط من الأبحاث سيستفيد من التحقيق النوعي في أوضاع الخطأ المختلفة لنماذج الحالة الحالية. لذلك، في هذا العمل، نقوم بإجراء مقارنة كمية ونوعية من ثلاثة نماذج تلخيص شفرة المصدر المقترحة مؤخرا. في تقييمنا الكمي، قارن النماذج المستندة إلى مقاييس الترجمة من BLEU-4 و Noteor و Rouge-L، وفي تقييمنا النوعي، نقوم بإجراء ترميز مفتوح يدوي لأخطاء الأكثر شيوعا التي ارتكبتها النماذج مقارنة مع تسميات الحقيقة الأرضية. يكشف تحقيقنا عن رؤى جديدة في العلاقة بين الأداء المستند إلى الأداء المتري وأخطاء التنبؤ بالنماذج التي تستند إلى تصنيف خطأ يمكن استخدامها لدفع جهود البحث في المستقبل.
Automated source code summarization is a popular software engineering research topic wherein machine translation models are employed to translate'' code snippets into relevant natural language descriptions. Most evaluations of such models are conducted using automatic reference-based metrics. However, given the relatively large semantic gap between programming languages and natural language, we argue that this line of research would benefit from a qualitative investigation into the various error modes of current state-of-the-art models. Therefore, in this work, we perform both a quantitative and qualitative comparison of three recently proposed source code summarization models. In our quantitative evaluation, we compare the models based on the smoothed BLEU-4, METEOR, and ROUGE-L machine translation metrics, and in our qualitative evaluation, we perform a manual open-coding of the most common errors committed by the models when compared to ground truth captions. Our investigation reveals new insights into the relationship between metric-based performance and model prediction errors grounded in an error taxonomy that can be used to drive future research efforts.
المراجع المستخدمة
https://aclanthology.org/
يعتبر التحكيم الإلكتروني و ما يصدر عنه من قرارات إلكترونية من أهم الوسائل
الحديثة لحل المنازعات الناتجة عن المعاملات التجارية الإلكترونية، و بما أن قرار
التحكيم الإلكتروني الذي يصدر عن هيئة التحكيم الإلكترونية، يتم بالوسائل الإلكترونية
سواء من حيث
يستخدم تمثيل الحالة المستندة إلى الإطار على نطاق واسع في أنظمة الحوار الحديثة الموجهة نحو المهام لنمو نوايا المستخدم وقيم الفتحة.ومع ذلك، فإن التصميم الثابت لعلم أطباق المجال يجعل من الصعب تمديد الخدمات الجديدة واجهات برمجة التطبيقات.العمل الأخير الم
شركات وسائل التواصل الاجتماعي وكذلك سلطات الرقابة تجعل الاستخدام المكثف للأدوات الذكاء الاصطناعي (AI) لمراقبة منشورات خطاب الكراهية أو الاحتفالات بالعنف أو الألفاظ النابية. نظرا لأن برنامج AI يتطلب كميات كبيرة من البيانات لتدريب أجهزة الكمبيوتر، يتم
يصف هذا العمل تحليل طبيعة وأسباب أخطاء MT التي لوحظها مقيمين مختلفين بموجب إرشادات لمعايير الجودة المختلفة: كفاية والفهم وعدم تحديد خليط عام من كفايته والطلاقة.نبلغ عن نتائج ثلاثة أزواج لغوية ومجالات ونظم من طراز MT.تشير النتائج الخاصة بنا إلى أنه وع
يهدف هذا البحث الى تحديد الدور المباشر لبعض العوامل التي تساهم في تحسين إنذار
الانثقابات العنقية و انثقابات مفترق الجذور التي يمكن أن تحدث خلال المعالجة اللبية من
خلال تطبيق مواد فعالة حيوياً خلال التدبير المحافظ غير الجراحي.