当前位置: X-MOL 学术arXiv.cs.PF › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Zero Queueing for Multi-Server Jobs
arXiv - CS - Performance Pub Date : 2020-11-20 , DOI: arxiv-2011.10521
Weina Wang, Qiaomin Xie, Mor Harchol-Balter

Cloud computing today is dominated by multi-server jobs. These are jobs that request multiple servers simultaneously and hold onto all of these servers for the duration of the job. Multi-server jobs add a lot of complexity to the traditional one-job-per-server model: an arrival might not "fit" into the available servers and might have to queue, blocking later arrivals and leaving servers idle. From a queueing perspective, almost nothing is understood about multi-server job queueing systems; even understanding the exact stability region is a very hard problem. In this paper, we investigate a multi-server job queueing model under scaling regimes where the number of servers in the system grows. Specifically, we consider a system with multiple classes of jobs, where jobs from different classes can request different numbers of servers and have different service time distributions, and jobs are served in first-come-first-served order. The multi-server job model opens up new scaling regimes where both the number of servers that a job needs and the system load scale with the total number of servers. Within these scaling regimes, we derive the first results on stability, queueing probability, and the transient analysis of the number of jobs in the system for each class. In particular we derive sufficient conditions for zero queueing. Our analysis introduces a novel way of extracting information from the Lyapunov drift, which can be applicable to a broader scope of problems in queueing systems.

中文翻译:

零排队的多服务器作业

当今的云计算主要由多服务器作业组成。这些是作业,它们同时请求多个服务器,并在作业过程中保留所有这些服务器。多服务器作业为传统的“每服务器一个作业”模型增加了很多复杂性:到达可能无法“适应”可用服务器,并且可能必须排队,从而阻止以后的到达并使服务器保持空闲。从排队的角度来看,对多服务器作业排队系统几乎一无所知。即使了解确切的稳定区域也是一个非常困难的问题。在本文中,我们研究了在扩展机制下系统中服务器数量不断增长的多服务器作业排队模型。具体来说,我们考虑一个具有多种工作类别的系统,其中不同类别的作业可以请求不同数量的服务器并具有不同的服务时间分配,并且以先到先得的顺序提供作业。多服务器作业模型打开了新的扩展方案,在该方案中,作业所需的服务器数量和系统负载均随服务器总数扩展。在这些缩放方式下,我们得出关于稳定性,排队概率以及对每个类别的系统中的作业数量进行瞬态分析的第一个结果。特别是,我们得出了零排队的充分条件。我们的分析引入了一种从Lyapunov漂移中提取信息的新颖方法,该方法可以应用于排队系统中更广泛的问题。多服务器作业模型打开了新的扩展方案,在该方案中,作业所需的服务器数量和系统负载均随服务器总数扩展。在这些缩放方式下,我们得出关于稳定性,排队概率以及对每个类别的系统中的作业数量进行瞬态分析的第一个结果。特别是,我们得出了零排队的充分条件。我们的分析引入了一种从Lyapunov漂移中提取信息的新颖方法,该方法可以应用于排队系统中更广泛的问题。多服务器作业模型打开了新的扩展方案,在该方案中,作业所需的服务器数量和系统负载均随服务器总数扩展。在这些缩放方式下,我们得出关于稳定性,排队概率以及对每个类别的系统中的作业数量进行瞬态分析的第一个结果。特别是,我们得出了零排队的充分条件。我们的分析引入了一种从Lyapunov漂移中提取信息的新颖方法,该方法可以应用于排队系统中更广泛的问题。并对每个类别的系统中的作业数量进行瞬态分析。特别是,我们得出了零排队的充分条件。我们的分析引入了一种从Lyapunov漂移中提取信息的新颖方法,该方法可以应用于排队系统中更广泛的问题。并对每个类别的系统中的作业数量进行瞬态分析。特别是,我们得出了零排队的充分条件。我们的分析引入了一种从Lyapunov漂移中提取信息的新颖方法,该方法可以应用于排队系统中更广泛的问题。
更新日期:2020-11-23
down
wechat
bug