1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究源代码变量名的自动语义标注.pdf

论文研究源代码变量名的自动语义标注.pdf

上传者: 2019-08-16 12:56:25上传 PDF文件 1.29MB 热度 65次
大规模开源代码社区为开发者提供了丰富的软件资产,但要理解和利用这些代码却十分耗时耗力。为寻求代码理解、分析和挖掘的语义支撑,针对源代码变量名进行了研究,提出了一种基于字段相似度与语义关联度的自动语义标注方法,并实现了相应的工具。该方法首先建立英文、中文、拼音语料库,并构建字段相似度模型生成多种候选标注方案;然后利用马尔可夫转移矩阵和语义网WordNet构建概率模型评选出最优的标注方案,从而实现源代码变量名的自动语义识别。使用GitHub开源项目代码进行标注准确度实验,结果表明,初次标注准确度达到68.1%,随着用户反馈增加逐步提升到73.3%。
下载地址
用户评论