当前位置: X-MOL 学术IMA J. Numer. Anal. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Mixed precision low-rank approximations and their application to block low-rank LU factorization
IMA Journal of Numerical Analysis ( IF 2.1 ) Pub Date : 2022-08-24 , DOI: 10.1093/imanum/drac037
Patrick Amestoy 1 , Olivier Boiteau 2 , Alfredo Buttari 3 , Matthieu Gerest 4, 5 , Fabienne Jézéquel 6 , Jean-Yves L’Excellent 1 , Theo Mary 7
Affiliation  

We introduce a novel approach to exploit mixed precision arithmetic for low-rank approximations. Our approach is based on the observation that singular vectors associated with small singular values can be stored in lower precisions while preserving high accuracy overall. We provide an explicit criterion to determine which level of precision is needed for each singular vector. We apply this approach to block low-rank (BLR) matrices, most of whose off-diagonal blocks have low rank. We propose a new BLR LU factorization algorithm that exploits the mixed precision representation of the blocks. We carry out the rounding error analysis of this algorithm and prove that the use of mixed precision arithmetic does not compromise the numerical stability of the BLR LU factorization. Moreover, our analysis determines which level of precision is needed for each floating-point operation (flop), and therefore guides us toward an implementation that is both robust and efficient. We evaluate the potential of this new algorithm on a range of matrices coming from real-life problems in industrial and academic applications. We show that a large fraction of the entries in the LU factors and flops to perform the BLR LU factorization can be safely switched to lower precisions, leading to significant reductions of the storage and expected time costs, of up to a factor three using fp64, fp32, and bfloat16 arithmetics.

中文翻译:

混合精度低秩近似及其在阻止低秩 LU 分解中的应用

我们引入了一种新颖的方法来利用混合精度算法进行低秩近似。我们的方法基于以下观察:与小奇异值相关的奇异向量可以以较低的精度存储,同时保持整体的高精度。我们提供了一个明确的标准来确定每个奇异向量需要哪个级别的精度。我们将这种方法应用于块低秩 (BLR) 矩阵,其中大多数非对角块具有低秩。我们提出了一种新的 BLR LU 分解算法,该算法利用了块的混合精度表示。我们对该算法进行了舍入误差分析,证明使用混合精度算法不会损害 BLR LU 分解的数值稳定性。而且,我们的分析确定了每个浮点运算 (flop) 所需的精度水平,因此指导我们实现既健壮又高效的实现。我们评估了这种新算法在来自工业和学术应用中的现实问题的一系列矩阵上的潜力。我们表明,执行 BLR LU 分解的 LU 因子和触发器中的大部分条目可以安全地切换到较低的精度,从而显着降低存储和预期时间成本,使用 fp64 最多可降低三倍, fp32 和 bfloat16 算术。我们评估了这种新算法在来自工业和学术应用中的现实问题的一系列矩阵上的潜力。我们表明,执行 BLR LU 分解的 LU 因子和触发器中的大部分条目可以安全地切换到较低的精度,从而显着降低存储和预期时间成本,使用 fp64 最多可降低三倍, fp32 和 bfloat16 算术。我们评估了这种新算法在来自工业和学术应用中的现实问题的一系列矩阵上的潜力。我们表明,执行 BLR LU 分解的 LU 因子和触发器中的大部分条目可以安全地切换到较低的精度,从而显着降低存储和预期时间成本,使用 fp64 最多可降低三倍, fp32 和 bfloat16 算术。
更新日期:2022-08-24
down
wechat
bug