自动识别文件的两个版本之间的差异是采矿代码存储库的几个应用程序中的常见和基本任务。
GIT是一种版本控制系统,具有差异实用程序,用户可以选择从默认算法Myers到高级直方图算法的差异算法。
从我们的系统映射中,我们在最近的研究中确定了DIFF的三个流行应用。
关于14个Java项目中代码流失指标的影响,我们根据不同的差异算法获得了1.7%至8.2%的不同值。
关于错误引入的变更识别,我们发现已确定的错误框架提交中有6.0%和13.3%的介绍在10个Java项目中的错误引入更改的结果不同。
对于补丁应用程序,我们发现直方图比迈尔斯更适合通过手动分析提供代码的更改。
2022年8月12日大约 51 分钟