软件研发效能实验室匡宏宇老师小组在多语言软件自动追踪恢复上取得新进展

发布日期:2024-08-09 浏览次数:


软件可追踪性恢复( Software Traceability Recovery )旨在捕捉软件开发过程中不同制品之间的联系( 如,需求和代码之间联系、 issue和commit之间联系 )。该项技术能够有效地帮助开发团队掌握并优化软件开发生命周期中的各个环节,从而提升软件质量和开发效率。主流的自动化追踪恢复技术通过利用IR( Information Retrieval )模型来衡量制品之间的关联程度,即制品之间的文本相似度越高,便越有可能存在联系。



然而,随着软件开发全球化程度的加深,制品中的多语言混用现象( 以双语混用,尤其是英-中双语混用为主 )为基于 IR 模型的追踪恢复技术带来了新的挑战。一词多语的表达(如 " 属性 " vs " attribute ")使得 IR 模型难以捕捉到制品间的实际关联。虽然使用翻译器能够在一定程度上缓解这个问题,但是翻译器在同一术语上的翻译不一致( 如,翻译器可能会根据上下文随机选择 " attribute " 或者 " property " 作为 " 属性 " 一词的翻译)仍然会在一定程度上损害自动追踪恢复技术的效果。



针对上述问题,软件研发效能实验室的匡宏宇老师及其指导的博士生孙可心同学创新性地提出了一种增强策略 AVIATE。该策略通过利用从软件制品的多种翻译变体中提取出的共识词对来丰富文本语义,以提升 IR 模型在双语制品上的自动追踪恢复表现。具体而言,该方法首先利用四种主流的翻译器对软件制品中存在多语言混用现象的句子进行翻译,为每个句子生成四种翻译变体;然后再利用自然语言解析工具 CoreNLP 从不同的翻译变体中抽取制品之间的共识词对,这些共识词对代表着制品在描述的系统功能和具体的翻译选词上均达成了一致;最后,对于从不同的翻译变体中提取到的若干共识词对,他们提出了一种类TF-IDF指标以筛选出更具代表性的共识词对来丰富软件制品;为确保共识词对中捕捉到的关键信息能够在IR模型中得到充分重视,他们将根据选中词对的代表性分数( 即计算得到的类TF-IDF分数 )进一步的调整他们在IR模型中的权重因子。基于17个双语项目(包括14个英-中项目,1个英-韩项目、1个英-韩项目、1个英-德项目)的实验表明 AVIATE 能够有效的增强基于 IR 的追踪恢复技术在双语软件制品上的表现,它为基线带来了平均31.4%的平均精度( Average Precision, AP )提升,和平均11.2%的平均精度均值( Mean Average Precision ,MAP )提升。


AVIATE通过引入多翻译器和基于类TF-IDF指标的筛选有效的解决了单翻译器在处理双语言制品时的术语翻译不一致问题,提高了基于IR模型的追踪恢复技术在语言混用场景下的应用表现。该工作相关研究成果《 AVIATE: Exploiting Translation Variants of Artifacts to Improve IR-based Traceability Recovery in Bilingual Software Projects 》现已被软件工程领域顶级国际会议 The 39th ACM/IEEE International Conference on Automated Software Engineering ( ASE 2024,CCF - A会议 )全文录用,南京大学为第一作者单位。


孙可心同学由马晓星教授和匡宏宇助理研究员共同指导,其主要研究方向包括软件可追踪性恢复和基于文本情绪分析的软件仓库挖掘,其研究成果先后发表在 ASE、ICPC、Internetware 等高水平软件工程国际会议上。