当前位置: X-MOL 学术J. Netw. Comput. Appl. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A two-phase virtual machine placement policy for data-intensive applications in cloud
Journal of Network and Computer Applications ( IF 8.7 ) Pub Date : 2021-02-17 , DOI: 10.1016/j.jnca.2021.103025
Samaneh Sadegh , Kamran Zamanifar , Piotr Kasprzak , Ramin Yahyapour

Cloud computing and big data are two technologies whose combination can yield many benefits and challenges. One of the most significant challenges is the traffic produced by data-intensive jobs within a data center. A possible way to manage the produced traffic is optimizing the placement of virtual machines (VM) on hosts. However, placing VMs compactly to reduce the communication cost can negatively impact on other aspects such as host utilization and load balancing. In this paper, we aim to make a balance between optimizing the host utilization and the communication cost while considering load balancing. We investigate the VM placement problem by modeling it as the minimum weight K-vertex-connected induced subgraph. We prove the NP-Hardness of the problem and propose a novel two-phase strategy for placing VMs on hosts. At first phase, in order to balance traffic and workload among racks, we rank all racks using a fuzzy inference system and select the best ones based on a linear programming model. At second phase, we introduce a novel greedy algorithm to assign each VM to a host regarding a proposed communication cost metric. We evaluate our approach using CloudSim simulator whose results show our two-phase strategy is able to make a balance between host utilization and network traffic. It keeps more than 80 percent of the traffic rack local while reduces the average network link saturation to almost 40 percent with a low variance. Besides, the number of used hosts increase linearly by increasing the number of VMs which leads to a higher host utilization.



中文翻译:

针对云中数据密集型应用程序的两阶段虚拟机放置策略

云计算和大数据是两种技术,它们的结合可以带来很多好处和挑战。最大的挑战之一是数据中心内数据密集型作业所产生的流量。管理产生的流量的一种可能方法是优化主机上虚拟机(VM)的放置。但是,紧凑地放置VM以降低通信成本可能会对其他方面产生负面影响,例如主机利用率和负载平衡。在本文中,我们旨在在考虑负载平衡的同时,在优化主机利用率和通信成本之间取得平衡。我们通过将其建模为最小权重K顶点连接的诱导子图来研究VM放置问题。我们证明了问题的NP-Hardness并提出了一种将VM放置在主机上的新颖的两阶段策略。在第一阶段 为了平衡机架之间的流量和工作量,我们使用模糊推理系统对所有机架进行排名,并根据线性规划模型选择最佳机架。在第二阶段,我们引入了一种新颖的贪婪算法,用于将每个VM分配给有关建议的通信成本指标的主机。我们使用CloudSim模拟器评估了我们的方法,其结果表明我们的两阶段策略能够在主机利用率和网络流量之间取得平衡。它可以将80%以上的流量机架保留在本地,同时将平均网络链路饱和度降低到几乎40%,且变化很小。此外,通过增加虚拟机的数量,使用的主机数量呈线性增加,从而导致更高的主机利用率。我们使用模糊推理系统对所有机架进行排名,并根据线性规划模型选择最佳机架。在第二阶段,我们引入了一种新颖的贪婪算法,用于将每个VM分配给有关建议的通信成本指标的主机。我们使用CloudSim模拟器评估了我们的方法,其结果表明我们的两阶段策略能够在主机利用率和网络流量之间取得平衡。它可以将80%以上的流量机架保留在本地,同时将平均网络链接饱和度降低到几乎40%,且变化很小。此外,通过增加虚拟机的数量,已使用主机的数量呈线性增加,从而导致更高的主机利用率。我们使用模糊推理系统对所有机架进行排名,并根据线性规划模型选择最佳机架。在第二阶段,我们引入了一种新颖的贪婪算法,用于将每个VM分配给有关建议的通信成本指标的主机。我们使用CloudSim模拟器评估了我们的方法,其结果表明我们的两阶段策略能够在主机利用率和网络流量之间取得平衡。它可以将80%以上的流量机架保留在本地,同时将平均网络链路饱和度降低到几乎40%,且变化很小。此外,通过增加虚拟机的数量,使用的主机数量呈线性增加,从而导致更高的主机利用率。我们使用CloudSim模拟器评估了我们的方法,其结果表明我们的两阶段策略能够在主机利用率和网络流量之间取得平衡。它可以将80%以上的流量机架保留在本地,同时将平均网络链路饱和度降低到几乎40%,且变化很小。此外,通过增加虚拟机的数量,已使用主机的数量呈线性增加,从而导致更高的主机利用率。我们使用CloudSim模拟器评估了我们的方法,其结果表明我们的两阶段策略能够在主机利用率和网络流量之间取得平衡。它可以将80%以上的流量机架保留在本地,同时将平均网络链路饱和度降低到几乎40%,且变化很小。此外,通过增加虚拟机的数量,使用的主机数量呈线性增加,从而导致更高的主机利用率。

更新日期:2021-02-24
down
wechat
bug