当前位置: X-MOL 学术IEEE Trans. Parallel Distrib. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Pattern-Based SpGEMM Library for Multi-Core and Many-Core Architectures
IEEE Transactions on Parallel and Distributed Systems ( IF 5.3 ) Pub Date : 2021-06-17 , DOI: 10.1109/tpds.2021.3090328
Zhen Xie , Guangming Tan , Weifeng Liu , Ninghui Sun

General sparse matrix-matrix multiplication (SpGEMM) is one of the most important mathematical library routines in a number of applications. In recent years, several efficient SpGEMM algorithms have been proposed, however, most of them are based on the compressed sparse row (CSR) format, and the possible performance gain from exploiting other formats has not been well studied. And some specific algorithms are restricted to parameter tuning that has a significant impact on performance. So the particular format, algorithm, and parameter that yield the best performance for SpGEMM remain undetermined. In this article, we conduct a prospective study on format-specific parallel SpGEMM algorithms and analyze their pros and cons. We then propose a pattern-based SpGEMM library, that provides a unified programming interface in the CSR format, analyses the pattern of two input matrices, and automatically determines the best format, algorithm, and parameter for arbitrary matrix pairs. For this purpose, we build an algorithm set that integrates three new designed algorithms with existing popular libraries, and design a hybrid deep learning model called MatNet to quickly identify patterns of input matrices and accurately predict the best solution by using sparse features and density representations. The evaluation shows that this library consistently outperforms the state-of-the-art library. We also demonstrate its adaptability in an AMG solver and a BFS algorithm with 30 percent performance improvement.

中文翻译:

用于多核和众核架构的基于模式的 SpGEMM 库

通用稀疏矩阵-矩阵乘法 (SpGEMM) 是许多应用程序中最重要的数学库例程之一。近年来,已经提出了几种有效的 SpGEMM 算法,但是,它们中的大多数基于压缩稀疏行 (CSR) 格式,并且利用其他格式可能带来的性能增益尚未得到很好的研究。并且某些特定算法仅限于对性能有重大影响的参数调整。因此,产生 SpGEMM 最佳性能的特定格式、算法和参数仍未确定。在本文中,我们对特定格式的并行 SpGEMM 算法进行了前瞻性研究,并分析了它们的优缺点。然后我们提出了一个基于模式的 SpGEMM 库,它以 CSR 格式提供统一的编程接口,分析两个输入矩阵的模式,并自动确定任意矩阵对的最佳格式、算法和参数。为此,我们构建了一个算法集,将三种新设计的算法与现有的流行库集成在一起,并设计了一个称为 MatNet 的混合深度学习模型,以通过使用稀疏特征和密度表示来快速识别输入矩阵的模式并准确预测最佳解决方案。评估表明,该库始终优于最先进的库。我们还展示了它在 AMG 求解器和 BFS 算法中的适应性,性能提高了 30%。我们构建了一个算法集,将三种新设计的算法与现有的流行库集成在一起,并设计了一个名为 MatNet 的混合深度学习模型,以通过使用稀疏特征和密度表示来快速识别输入矩阵的模式并准确预测最佳解决方案。评估表明,该库始终优于最先进的库。我们还展示了它在 AMG 求解器和 BFS 算法中的适应性,性能提高了 30%。我们构建了一个算法集,将三种新设计的算法与现有的流行库集成在一起,并设计了一个名为 MatNet 的混合深度学习模型,以通过使用稀疏特征和密度表示来快速识别输入矩阵的模式并准确预测最佳解决方案。评估表明,该库始终优于最先进的库。我们还展示了它在 AMG 求解器和 BFS 算法中的适应性,性能提高了 30%。评估表明,该库始终优于最先进的库。我们还展示了它在 AMG 求解器和 BFS 算法中的适应性,性能提高了 30%。评估表明,该库始终优于最先进的库。我们还展示了它在 AMG 求解器和 BFS 算法中的适应性,性能提高了 30%。
更新日期:2021-07-13
down
wechat
bug