当前位置: X-MOL 学术Softw. Pract. Exp. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Feature location enhancement based on source code augmentation with synonyms of terms
Software: Practice and Experience ( IF 3.5 ) Pub Date : 2020-09-17 , DOI: 10.1002/spe.2900
Ahmad A. Saifan 1 , Lana Obeidat 1
Affiliation  

In software maintenance the developers may add new feature to program, improve existing function, and remove bugs. In this case the developer should identify the location in the source code that corresponds to a specific functionality; this is known as feature location. This presents a new approach for enhancing the process of feature location using Information Retrieval (IR) and Natural Language Processing. The approach presented augments the source code with additional semantic information that was extracted and derived from the synonyms of source code terms. This approach works in a pipeline structure, starting by augmenting the source code corpus with synonyms of the original terms and ending by inferring the source code with a particular user query. More specifically, the WordNet platform is used for extracting the synonyms of terms. Moreover, the approach uses an advanced IR technique, namely the Latent Semantic Indexing, for searching and inferring the source code. The used approach was tested and evaluated on two open source systems, namely the Qt and Hippodraw. Four experiments were conducted on each system using 21 features and the results showed that enriching the source code with synonyms of terms clearly and significantly improved the process of feature location efficiently. The experimental results showed that the approach presented obtained higher levels of Recall and Precision. For that reason, it has been shown to improve the state‐of‐the‐art techniques for feature location process.

中文翻译:

基于同义词源代码增强的特征定位增强

在软件维护中,开发人员可能会向程序添加新功能、改进现有功能并删除错误。在这种情况下,开发人员应确定源代码中与特定功能相对应的位置;这称为特征位置。这提出了一种使用信息检索 (IR) 和自然语言处理来增强特征定位过程的新方法。所提出的方法使用从源代码术语的同义词中提取和派生的附加语义信息来扩充源代码。这种方法在管道结构中工作,首先用原始术语的同义词扩充源代码语料库,最后用特定用户查询推断源代码。更具体地说,WordNet 平台用于提取术语的同义词。而且,该方法使用先进的 IR 技术,即潜在语义索引,用于搜索和推断源代码。所使用的方法在两个开源系统上进行了测试和评估,即 Qt 和 Hippodraw。对每个系统使用 21 个特征进行了 4 次实验,结果表明,用术语的同义词丰富源代码可以清晰、显着地提高特征定位过程的效率。实验结果表明,所提出的方法获得了更高水平的召回率和精确率。出于这个原因,它已被证明可以改进用于特征定位过程的最先进技术。所使用的方法在两个开源系统上进行了测试和评估,即 Qt 和 Hippodraw。对每个系统使用 21 个特征进行了 4 次实验,结果表明,用术语的同义词丰富源代码可以清晰、显着地提高特征定位过程的效率。实验结果表明,所提出的方法获得了更高水平的召回率和精确率。出于这个原因,它已被证明可以改进用于特征定位过程的最先进技术。所使用的方法在两个开源系统上进行了测试和评估,即 Qt 和 Hippodraw。对每个系统使用 21 个特征进行了 4 次实验,结果表明,用术语的同义词丰富源代码可以清晰、显着地提高特征定位过程的效率。实验结果表明,所提出的方法获得了更高水平的召回率和精确率。出于这个原因,它已被证明可以改进用于特征定位过程的最先进技术。实验结果表明,所提出的方法获得了更高水平的召回率和精确率。出于这个原因,它已被证明可以改进用于特征定位过程的最先进技术。实验结果表明,所提出的方法获得了更高水平的召回率和精确率。出于这个原因,它已被证明可以改进用于特征定位过程的最先进技术。
更新日期:2020-09-17
down
wechat
bug