يكتب مطورو البرمجيات الكثير من التعليمات البرمجية المصدر والوثائق أثناء تطوير البرمجيات. جوهريا، غالبا ما يتذكر المطورون أجزاء من شفرة المصدر أو ملخصات التعليمات البرمجية التي كتبوها في الماضي أثناء تنفيذ البرامج أو توثيقها. لتقليل رمز المطور أو سلوك الجيل الموجز، نقترح إطارا معدليا استرجاعا، ريدكودر، الذي يسترد الكود أو الملخصات ذات الصلة من قاعدة بيانات استرجاع ويوفر لهم كملحق لجيل التعليمات أو نماذج التلخيص. ريدكودر لديه زوجين من التفرد. أولا، إنه يمتد تقنية استرجاع حديثة كثيفة الاستخدام للبحث عن التعليمات البرمجية أو الملخصات ذات الصلة. ثانيا، يمكن أن تعمل مع قواعد بيانات استرجاع تشمل Unimodal (رمز فقط أو وصف اللغة الطبيعية) أو مثيلات BIMODAL (أزواج الكود الوصف). نقوم بإجراء تجارب وتحليل مكثف على مجموعة بيانات قياسية لتوليد التعليمات البرمجية والتلخيص في جاوة وبيرثون، والنتائج الواعدة تؤيد فعالية الإطار المعزز المقترح لاسترجاعنا.
Software developers write a lot of source code and documentation during software development. Intrinsically, developers often recall parts of source code or code summaries that they had written in the past while implementing software or documenting them. To mimic developers' code or summary generation behavior, we propose a retrieval augmented framework, REDCODER, that retrieves relevant code or summaries from a retrieval database and provides them as a supplement to code generation or summarization models. REDCODER has a couple of uniqueness. First, it extends the state-of-the-art dense retrieval technique to search for relevant code or summaries. Second, it can work with retrieval databases that include unimodal (only code or natural language description) or bimodal instances (code-description pairs). We conduct experiments and extensive analysis on two benchmark datasets of code generation and summarization in Java and Python, and the promising results endorse the effectiveness of our proposed retrieval augmented framework.
المراجع المستخدمة
https://aclanthology.org/
تظل تحفيز الرسوم البيانية المعرفة عالية الجودة عالية الجودة من مجموعة معينة من الوثائق مشكلة صعبة في منظمة العفو الدولية. تتمثل إحدى الطرق في إحدى الطرق في هذه المشكلة من خلال التقدم في مهمة ذات صلة تعرف باسم ملء الفتحة. في هذه المهمة، نظرا لاستعلام
تدرس هذه الورقة مهمة جيل تسييس الهدسة (KG) للسيناريوهات التي يلعب فيها الهيكل دورا مهما. على سبيل المثال، يتكون المنشور العلمي من عنوان قصير وجسم طويل، حيث يمكن استخدام العنوان لإلغاء التأكيد على التفاصيل غير المهمة في الجسم. وبالمثل، لوظائف وسائل ال
جيل النص هو مجال نشط للغاية في البحث في المجتمع اللغوي الحسابي.يعد تقييم النص الذي تم إنشاؤه مهمة صعبة وتم اقتراح نظريات ومقاييس متعددة على مر السنين.لسوء الحظ، يتم إدراج توليد النص والتقييم نسبيا نسبيا بسبب ندرة الموارد عالية الجودة في اللغات المختل
في هذه الورقة، ندرس تلخيص الجملة المبادرة.هناك ميزان معلومات أساسية يمكن أن تؤثر على جودة تلخيص الأخبار، والتي هي الكلمات الرئيسية للموضوع والهيكل المعرفي لنص الأخبار.علاوة على ذلك، فإن تشفير المعرفة الموجودة لديها أداء ضعيف في هيكل المعرفة بالقضاء ا
وجدت أنظمة توليد النص المختلط من التعليمات البرمجية قد وجدت تطبيقات في العديد من المهام المصب، بما في ذلك التعرف على الكلام والترجمة والحوار.تعتمد نموذج أنظمة الجيل هذه على نظريات النحوية المحددة جيدا من خلط التعليمات البرمجية، وهناك نقص في مقارنة هذ