当前位置: X-MOL 学术Concurr. Comput. Pract. Exp. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A novel data partitioning algorithm for dynamic energy optimization on heterogeneous high‐performance computing platforms
Concurrency and Computation: Practice and Experience ( IF 2 ) Pub Date : 2020-07-22 , DOI: 10.1002/cpe.5928
Hamidreza Khaleghzadeh 1 , Muhammad Fahad 1 , Ravi Reddy Manumachu 1 , Alexey Lastovetsky 1
Affiliation  

Energy is one of the most important objectives for optimization on modern heterogeneous high‐performance computing (HPC) platforms. The tight integration of multicore CPUs with accelerators such as graphical processing units (GPUs) and Xeon Phi coprocessors in these platforms presents several challenges to the optimization of multithreaded data‐parallel applications for energy. In this work, the problem of optimization of data‐parallel applications on heterogeneous HPC platforms for dynamic energy through workload distribution is formulated. We propose a workload partitioning algorithm to solve this problem. It employs load‐imbalancing technique to determine the workload distribution minimizing the dynamic energy consumption of the parallel execution of an application. The inputs to the algorithm are discrete dynamic energy profiles of individual computing devices. The profiles are practically constructed using an approach that accurately models the energy consumption by execution of a hybrid scientific data‐parallel application on a heterogeneous platform containing different computing devices such as CPU, GPU, and Xeon Phi. The proposed algorithm is experimentally analyzed using two multithreaded data‐parallel applications, matrix multiplication and 2D fast Fourier transform. The load‐imbalanced solutions provided by the algorithm achieve significant dynamic energy reductions for the two applications (in average by 130% and 44%, respectively) compared with the load‐balanced solutions.

中文翻译:

一种用于异构高性能计算平台动态能量优化的新数据分区算法

能源是现代异构高性能计算 (HPC) 平台上最重要的优化目标之一。在这些平台中,多核 CPU 与加速器(例如图形处理单元 (GPU) 和至强融核协处理器)的紧密集成对优化多线程数据并行应用程序的能源提出了若干挑战。在这项工作中,制定了通过工作负载分配优化异构 HPC 平台上的数据并行应用程序以获得动态能量的问题。我们提出了一种工作负载划分算法来解决这个问题。它采用负载不平衡技术来确定工作负载分布,从而最大限度地减少应用程序并行执行的动态能耗。该算法的输入是单个计算设备的离散动态能量分布。这些配置文件实际上是使用一种方法构建的,该方法通过在包含不同计算设备(如 CPU、GPU 和至强融核)的异构平台上执行混合科学数据并行应用程序来准确地对能源消耗进行建模。使用两个多线程数据并行应用程序、矩阵乘法和二维快速傅立叶变换对所提出的算法进行了实验分析。与负载平衡解决方案相比,该算法提供的负载不平衡解决方案实现了两个应用程序的显着动态能量降低(分别平均降低了 130% 和 44%)。这些配置文件实际上是使用一种方法构建的,该方法通过在包含不同计算设备(如 CPU、GPU 和至强融核)的异构平台上执行混合科学数据并行应用程序来准确地对能源消耗进行建模。使用两个多线程数据并行应用程序、矩阵乘法和二维快速傅立叶变换对所提出的算法进行了实验分析。与负载平衡解决方案相比,该算法提供的负载不平衡解决方案在两个应用程序中实现了显着的动态能量降低(平均分别降低了 130% 和 44%)。这些配置文件实际上是使用一种方法构建的,该方法通过在包含不同计算设备(如 CPU、GPU 和至强融核)的异构平台上执行混合科学数据并行应用程序来准确地模拟能耗。使用两个多线程数据并行应用程序、矩阵乘法和二维快速傅立叶变换对所提出的算法进行了实验分析。与负载平衡解决方案相比,该算法提供的负载不平衡解决方案在两个应用程序中实现了显着的动态能量降低(平均分别降低了 130% 和 44%)。使用两个多线程数据并行应用程序、矩阵乘法和二维快速傅立叶变换对所提出的算法进行了实验分析。与负载平衡解决方案相比,该算法提供的负载不平衡解决方案在两个应用程序中实现了显着的动态能量降低(平均分别降低了 130% 和 44%)。使用两个多线程数据并行应用程序、矩阵乘法和二维快速傅立叶变换对所提出的算法进行了实验分析。与负载平衡解决方案相比,该算法提供的负载不平衡解决方案在两个应用程序中实现了显着的动态能量降低(平均分别降低了 130% 和 44%)。
更新日期:2020-07-22
down
wechat
bug