当前位置: X-MOL 学术IEEE Trans. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
PARMA: Parallelization-Aware Run-time Management forEnergy-Efficient Many-Core Systems
IEEE Transactions on Computers ( IF 3.6 ) Pub Date : 2020-10-01 , DOI: 10.1109/tc.2020.2975787
Mohammed A. Noaman Al-hayanni , Ashur Rafiev , Fei Xia , Rishad Shafik , Alexander Romanovsky , Alex Yakovlev

Performance and energy efficiency considerations have shifted computing paradigms from single-core to many-core architectures. At the same time, traditional speedup models such as Amdahl's Law face challenges in the run-time reasoning for system performance and energy efficiency, because these models typically assume limited variations of the parallel fraction. Moreover, the parallel fraction, which varies dynamically in workloads, is generally unknown at run-time without application-level instrumentation. This article describes novel performance/energy trade-off models based on realistic architectural considerations, which describe the parallel fraction and speedup as functions of performance counter values available in modern processors, removing the need for application-level instrumentation. These are then used to develop a Parallelization-Aware Run-time Management (PARMA) approach. PARMA aims at controlling core allocations and operating voltage/frequency points for energy efficiency, according to the varying workload parallel fractions. The efficacy of our models and the PARMA approach is extensively validated using a number of PARSEC benchmark applications, involving two performance/energy trade-off metrics: energy-delay-product (EDP), typically used in high-performance applications and energy per instruction (EPI), suitable for energy-aware applications. Up to 48 and 68 percent improvements in EDP and EPI have been observed using the PARMA approach compared with parallelization-agnostic methods.

中文翻译:

PARMA:面向节能多核系统的并行化感知运行时管理

性能和能效方面的考虑已将计算范式从单核架构转变为众核架构。与此同时,传统的加速模型(如阿姆达尔定律)在系统性能和能源效率的运行时推理方面面临挑战,因为这些模型通常假设并行部分的变化有限。此外,在工作负载中动态变化的并行部分在没有应用程序级检测的情况下在运行时通常是未知的。本文描述了基于现实架构考虑的新型性能/能量权衡模型,这些模型将并行分数和加速描述为现代处理器中可用的性能计数器值的函数,从而消除了对应用程序级检测的需求。然后将它们用于开发并行化感知运行时管理 (PARMA) 方法。PARMA 旨在根据不同的工作负载并行部分控制内核分配和工作电压/频率点以提高能效。我们的模型和 PARMA 方法的功效已使用许多 PARSEC 基准应用程序进行了广泛验证,涉及两个性能/能源权衡指标:能量延迟积 (EDP),通常用于高性能应用程序和每条指令的能量(EPI),适用于能量感知应用。与并行化不可知的方法相比,使用 PARMA 方法观察到的 EDP 和 EPI 改进高达 48% 和 68%。PARMA 旨在根据不同的工作负载并行部分控制内核分配和工作电压/频率点以提高能效。我们的模型和 PARMA 方法的功效使用许多 PARSEC 基准应用程序进行了广泛验证,涉及两个性能/能量权衡指标:能量延迟积 (EDP),通常用于高性能应用程序和每条指令的能量(EPI),适用于能量感知应用。与并行化不可知的方法相比,使用 PARMA 方法观察到的 EDP 和 EPI 改进高达 48% 和 68%。PARMA 旨在根据不同的工作负载并行部分控制内核分配和工作电压/频率点以提高能效。我们的模型和 PARMA 方法的功效已使用许多 PARSEC 基准应用程序进行了广泛验证,涉及两个性能/能源权衡指标:能量延迟积 (EDP),通常用于高性能应用程序和每条指令的能量(EPI),适用于能量感知应用。与并行化不可知的方法相比,使用 PARMA 方法观察到的 EDP 和 EPI 改进高达 48% 和 68%。涉及两个性能/能量权衡指标:能量延迟积 (EDP),通常用于高性能应用程序和每指令能量 (EPI),适用于能量感知应用程序。与并行化不可知的方法相比,使用 PARMA 方法观察到的 EDP 和 EPI 改进高达 48% 和 68%。涉及两个性能/能量权衡指标:能量延迟积 (EDP),通常用于高性能应用程序和每指令能量 (EPI),适用于能量感知应用程序。与并行化不可知的方法相比,使用 PARMA 方法观察到的 EDP 和 EPI 改进高达 48% 和 68%。
更新日期:2020-10-01
down
wechat
bug