应用软件工程技术中心代码定位研究成果被ESEC/FSE2022录用

发布日期:2022-06-16 浏览次数:


应用软件工程技术中心李传艺老师和葛季栋老师指导的胡鑫雯(2019级学硕)、郭宇(2020级专硕)、陆建杰(2021级专硕)和朱哲凌(2021级专硕)等四位同学在AI增强的软件开发技术研究中取得重要进展,首次使能监督学习技术在基于用户评论的代码定位任务上的应用,研究成果被软工顶会ESEC/FSE 2022(CCF A类)录用。


随着移动应用程序的用户评论(URs)被证明可以为维护和发展应用程序提供有价值的反馈,如何在移动应用的发布周期中有效地利用URs,在软件工程(SE)社区已成为一个广泛关注和研究的话题。为了加速完成URs相关的编码工作,并尽可能缩短软件发布周期,本文深入研究基于用户评论的代码定位任务(Review2Code)。



然而,现有Review2Code的解决方案都是基于无监督学习的,在软工任务上优势日益明显的基于监督学习的AI方法还未得到应用,其根本原因是缺乏大规模Ground-Truth数据集(即真正相关的< UR,Code >)。为使能基于监督学习的Review2Code相关研究,本文首先提出并构造了大规模人工标记的< UR,Code >数据集,详细介绍了原始数据、标注过程和标注结果分析。其次,文章综述、分析并最终选择了4个现有的深度学习模型作为Review2Code的Baseline。最后,基于数据集和Baseline为基于监督学习的Review2Code建立了首个Benchmark,为深入探索更优的Review2Code方法提供了数据和实验基础。



欢迎并期待对该工作感兴趣的朋友们来信交流:lcy@nju.edu.cn