当前位置: X-MOL 学术arXiv.cs.DB › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
MigCast in Monte Carlo: The Impact of Data Model Evolution in NoSQL Databases
arXiv - CS - Databases Pub Date : 2021-04-23 , DOI: arxiv-2104.11787
Andrea Hillenbrand, Uta Störl, Shamil Nabiyev, Stefanie Scherzinger

During the development of NoSQL-backed software, the data model evolves naturally alongside the application code. Especially in agile development, new application releases are deployed frequently causing schema changes. Eventually, decisions have to be made regarding the migration of versioned legacy data which is persisted in the cloud-hosted production database. We solve this schema evolution problem and present the results of near-exhaustive calculations by means of which software project stakeholders can manage the operative costs for data model evolution and adapt their software release strategy accordingly in order to comply with service-level agreements regarding the competing metrics of migration costs and latency. We clarify conclusively how data model evolution in NoSQL databases impacts the metrics while taking all relevant characteristics of migration scenarios into account. As calculating all possible combinatorics in the search space of migration scenarios would by far exceed computational means, we used a probabilistic Monte Carlo method of repeated sampling, serving as a well-established means to bring the complexity of data model evolution under control. Our experiments show the qualitative and quantitative impact on the performance of migration strategies with respect to intensity and distribution of data entity accesses, the kinds of schema changes, and the characteristics of the underlying data model.

中文翻译:

蒙特卡洛的MigCast:NoSQL数据库中数据模型演变的影响

在由NoSQL支持的软件的开发过程中,数据模型与应用程序代码一起自然地发展。特别是在敏捷开发中,经常部署新的应用程序版本,从而导致架构更改。最终,必须做出决定,以迁移保留在云托管生产数据库中的版本化旧数据。我们解决了这种模式演化问题,并提出了近乎穷尽的计算结果,软件项目涉众可以借此来管理数据模型演化的运营成本并相应地调整其软件发布策略,从而遵守与竞争有关的服务水平协议迁移成本和延迟的指标。我们最终确定了NoSQL数据库中的数据模型演变如何影响指标,同时考虑了迁移方案的所有相关特征。由于在迁移方案的搜索空间中计算所有可能的组合运算远远超出了计算方式,因此我们使用了概率蒙特卡洛方法进行重复采样,这是一种行之有效的方法,可以控制数据模型演化的复杂性。我们的实验表明,迁移策略在数据实体访问的强度和分布,架构更改的种类以及基础数据模型的特征方面,对迁移策略的性能产生了定性和定量的影响。由于在迁移方案的搜索空间中计算所有可能的组合运算远远超出了计算方式,因此我们使用了概率蒙特卡洛方法进行重复采样,这是一种行之有效的方法,可以控制数据模型演化的复杂性。我们的实验表明,迁移策略在数据实体访问的强度和分布,架构更改的种类以及基础数据模型的特征方面,对迁移策略的性能产生了定性和定量的影响。由于在迁移方案的搜索空间中计算所有可能的组合运算远远超出了计算方式,因此我们使用了概率蒙特卡洛方法进行重复采样,这是一种行之有效的方法,可以控制数据模型演化的复杂性。我们的实验表明,迁移策略在数据实体访问的强度和分布,架构更改的种类以及基础数据模型的特征方面,对迁移策略的性能产生了定性和定量的影响。
更新日期:2021-04-27
down
wechat
bug