当前位置: X-MOL 学术ACM Comput. Surv. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Natural Language Processing for Requirements Engineering
ACM Computing Surveys ( IF 23.8 ) Pub Date : 2021-04-17 , DOI: 10.1145/3444689
Liping Zhao 1 , Waad Alhoshan 2 , Alessio Ferrari 3 , Keletso J. Letsholo 4 , Muideen A. Ajagbe 1 , Erol-Valeriu Chioasca 5 , Riza T. Batista-Navarro 1
Affiliation  

Natural Language Processing for Requirements Engineering (NLP4RE) is an area of research and development that seeks to apply natural language processing (NLP) techniques, tools, and resources to the requirements engineering (RE) process, to support human analysts to carry out various linguistic analysis tasks on textual requirements documents, such as detecting language issues, identifying key domain concepts, and establishing requirements traceability links. This article reports on a mapping study that surveys the landscape of NLP4RE research to provide a holistic understanding of the field. Following the guidance of systematic review, the mapping study is directed by five research questions, cutting across five aspects of NLP4RE research, concerning the state of the literature, the state of empirical research, the research focus, the state of tool development, and the usage of NLP technologies. Our main results are as follows: (i) we identify a total of 404 primary studies relevant to NLP4RE, which were published over the past 36 years and from 170 different venues; (ii) most of these studies (67.08%) are solution proposals, assessed by a laboratory experiment or an example application, while only a small percentage (7%) are assessed in industrial settings; (iii) a large proportion of the studies (42.70%) focus on the requirements analysis phase, with quality defect detection as their central task and requirements specification as their commonly processed document type; (iv) 130 NLP4RE tools (i.e., RE specific NLP tools) are extracted from these studies, but only 17 of them (13.08%) are available for download; (v) 231 different NLP technologies are also identified, comprising 140 NLP techniques, 66 NLP tools, and 25 NLP resources, but most of them—particularly those novel NLP techniques and specialized tools—are used infrequently; by contrast, commonly used NLP technologies are traditional analysis techniques (e.g., POS tagging and tokenization), general-purpose tools (e.g., Stanford CoreNLP and GATE) and generic language lexicons (WordNet and British National Corpus). The mapping study not only provides a collection of the literature in NLP4RE but also, more importantly, establishes a structure to frame the existing literature through categorization, synthesis and conceptualization of the main theoretical concepts and relationships that encompass both RE and NLP aspects. Our work thus produces a conceptual framework of NLP4RE. The framework is used to identify research gaps and directions, highlight technology transfer needs, and encourage more synergies between the RE community, the NLP one, and the software and systems practitioners. Our results can be used as a starting point to frame future studies according to a well-defined terminology and can be expanded as new technologies and novel solutions emerge.

中文翻译:

需求工程的自然语言处理

需求工程自然语言处理 (NLP4RE) 是一个研究和开发领域,旨在将自然语言处理 (NLP) 技术、工具和资源应用于需求工程 (RE) 流程,以支持人类分析师执行各种语言文本需求文档的分析任务,例如检测语言问题、识别关键领域概念和建立需求可追溯性链接。本文报道了一项地图研究,该研究调查了 NLP4RE 研究的前景,以提供对该领域的全面了解。在系统评价的指导下,映射研究以五个研究问题为导向,横跨NLP4RE研究的五个方面,涉及文献状况、实证研究状况、研究重点、工具开发的状态,以及 NLP 技术的使用。我们的主要结果如下:(i)我们确定了总共 404 项与 NLP4RE 相关的主要研究,这些研究在过去 36 年中从 170 个不同地点发表;(ii) 大多数这些研究 (67.08%) 是解决方案建议,通过实验室实验或示例应用进行评估,而只有一小部分 (7%) 在工业环境中进行评估;(iii) 大部分研究(42.70%)集中在需求分析阶段,质量缺陷检测是他们的中心任务,需求规范是他们通常处理的文档类型;(iv) 从这些研究中提取了 130 个 NLP4RE 工具(即 RE 特定的 NLP 工具),但其中只有 17 个(13.08%)可供下载;(v) 还确定了 231 种不同的 NLP 技术,包括 140 种 NLP 技术、66 种 NLP 工具和 25 种 NLP 资源,但其中大部分——尤其是那些新颖的 NLP 技术和专门工具——很少使用;相比之下,常用的 NLP 技术是传统的分析技术(例如,POS 标记和标记化)、通用工具(例如,Stanford CoreNLP 和 GATE)和通用语言词典(WordNet 和英国国家语料库)。映射研究不仅提供了 NLP4RE 文献的集合,而且更重要的是,通过对涵盖 RE 和 NLP 方面的主要理论概念和关系进行分类、综合和概念化,建立了一个框架来构建现有文献的结构。因此,我们的工作产生了 但它们中的大多数——尤其是那些新颖的 NLP 技术和专用工具——很少使用;相比之下,常用的 NLP 技术是传统的分析技术(例如,POS 标记和标记化)、通用工具(例如,Stanford CoreNLP 和 GATE)和通用语言词典(WordNet 和英国国家语料库)。映射研究不仅提供了 NLP4RE 文献的集合,而且更重要的是,通过对涵盖 RE 和 NLP 方面的主要理论概念和关系进行分类、综合和概念化,建立了一个框架来构建现有文献的结构。因此,我们的工作产生了 但它们中的大多数——尤其是那些新颖的 NLP 技术和专用工具——很少使用;相比之下,常用的 NLP 技术是传统的分析技术(例如,POS 标记和标记化)、通用工具(例如,Stanford CoreNLP 和 GATE)和通用语言词典(WordNet 和英国国家语料库)。映射研究不仅提供了 NLP4RE 文献的集合,而且更重要的是,通过对涵盖 RE 和 NLP 方面的主要理论概念和关系进行分类、综合和概念化,建立了一个框架来构建现有文献的结构。因此,我们的工作产生了 通用工具(例如,Stanford CoreNLP 和 GATE)和通用语言词典(WordNet 和英国国家语料库)。映射研究不仅提供了 NLP4RE 文献的集合,而且更重要的是,通过对涵盖 RE 和 NLP 方面的主要理论概念和关系进行分类、综合和概念化,建立了一个框架来构建现有文献的结构。因此,我们的工作产生了 通用工具(例如,Stanford CoreNLP 和 GATE)和通用语言词典(WordNet 和英国国家语料库)。映射研究不仅提供了 NLP4RE 文献的集合,而且更重要的是,通过对涵盖 RE 和 NLP 方面的主要理论概念和关系进行分类、综合和概念化,建立了一个框架来构建现有文献的结构。因此,我们的工作产生了 涵盖 RE 和 NLP 方面的主要理论概念和关系的综合和概念化。因此,我们的工作产生了 涵盖 RE 和 NLP 方面的主要理论概念和关系的综合和概念化。因此,我们的工作产生了概念框架NLP4RE 的。该框架用于确定研究差距和方向,突出技术转让需求,并鼓励 RE 社区、NLP 社区以及软件和系统从业者之间的更多协同作用。我们的结果可以用作根据明确定义的术语构建未来研究的起点,并且可以随着新技术和新解决方案的出现而扩展。
更新日期:2021-04-17
down
wechat
bug