当前位置: X-MOL 学术Int. J. Parallel. Program › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Characterizing Scalability of Sparse Matrix–Vector Multiplications on Phytium FT-2000+
International Journal of Parallel Programming ( IF 1.5 ) Pub Date : 2019-11-15 , DOI: 10.1007/s10766-019-00646-x
Donglin Chen , Jianbin Fang , Chuanfu Xu , Shizhao Chen , Zheng Wang

Understanding the scalability of parallel programs is crucial for software optimization and hardware architecture design. As HPC hardware is moving towards many-core design, it becomes increasingly difficult for a parallel program to make effective use of all available processor cores. This makes scalability analysis increasingly important. This paper presents a quantitative study for characterizing the scalability of sparse matrix–vector multiplications (SpMV) on Phytium FT-2000+, an ARM-based HPC many-core architecture. We choose SpMV as it is a common operation in scientific and HPC applications. Due to the newness of ARM-based many-core architectures, there is little work on understanding the SpMV scalability on such hardware design. To close the gap, we carry out a large-scale empirical evaluation involved over 1000 representative SpMV datasets. We show that, while many computation-intensive SpMV applications contain extensive parallelism, achieving a linear speedup is non-trivial on Phytium FT-2000+. To better understand what software and hardware parameters are most important for determining the scalability of a given SpMV kernel, we develop a performance analytical model based on the regression tree. We show that our model is highly effective in characterizing SpMV scalability, offering useful insights to help application developers for better optimizing SpMV on an emerging HPC architecture.

中文翻译:

在 Phytium FT-2000+ 上表征稀疏矩阵 - 向量乘法的可扩展性

了解并行程序的可扩展性对于软件优化和硬件架构设计至关重要。随着 HPC 硬件向多核设计发展,并行程序越来越难以有效利用所有可用的处理器内核。这使得可扩展性分析变得越来越重要。本文提出了一项定量研究,用于表征 Phytium FT-2000+(一种基于 ARM 的 HPC 众核架构)上的稀疏矩阵向量乘法 (SpMV) 的可扩展性。我们选择 SpMV 是因为它是科学和 HPC 应用中的常见操作。由于基于 ARM 的众核架构的新颖性,在此类硬件设计上了解 SpMV 可扩展性的工作很少。为了缩小差距,我们进行了涉及 1000 多个具有代表性的 SpMV 数据集的大规模实证评估。我们表明,虽然许多计算密集型 SpMV 应用程序包含广泛的并行性,但在 Phytium FT-2000+ 上实现线性加速并非易事。为了更好地了解哪些软件和硬件参数对于确定给定 SpMV 内核的可扩展性最重要,我们开发了一个基于回归树的性能分析模型。我们展示了我们的模型在表征 SpMV 可扩展性方面非常有效,提供了有用的见解来帮助应用程序开发人员在新兴的 HPC 架构上更好地优化 SpMV。为了更好地了解哪些软件和硬件参数对于确定给定 SpMV 内核的可扩展性最重要,我们开发了一个基于回归树的性能分析模型。我们展示了我们的模型在表征 SpMV 可扩展性方面非常有效,提供了有用的见解来帮助应用程序开发人员在新兴的 HPC 架构上更好地优化 SpMV。为了更好地了解哪些软件和硬件参数对于确定给定 SpMV 内核的可扩展性最重要,我们开发了一个基于回归树的性能分析模型。我们展示了我们的模型在表征 SpMV 可扩展性方面非常有效,提供了有用的见解来帮助应用程序开发人员在新兴的 HPC 架构上更好地优化 SpMV。
更新日期:2019-11-15
down
wechat
bug