当前位置: X-MOL 学术J. Fluids Struct. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
HPC compact quasi-Newton algorithm for interface problems
Journal of Fluids and Structures ( IF 3.6 ) Pub Date : 2020-07-01 , DOI: 10.1016/j.jfluidstructs.2020.103009
Alfonso Santiago , Miguel Zavala-Aké , Ricard Borrell , Guillaume Houzeaux , Mariano Vázquez

Abstract In this work we present a robust interface coupling algorithm called Compact Interface quasi-Newton (CIQN). It is designed for computationally intensive applications using an MPI multi-code partitioned scheme. The algorithm allows to reuse information from previous time steps, feature that has been previously proposed to accelerate convergence. Through algebraic manipulation, an efficient usage of the computational resources is achieved by: avoiding construction of dense matrices and reduce every multiplication to a matrix–vector product and reusing the computationally expensive loops. This leads to a compact version of the original quasi-Newton algorithm. Altogether with an efficient communication, in this paper we show an efficient scalability up to 4800 cores. Three examples with qualitatively different dynamics are shown to prove that the algorithm can efficiently deal with added mass instability and two-field coupled problems. We also show how reusing histories and filtering does not necessarily makes a more robust scheme and, finally, we prove the necessity of this HPC version of the algorithm. The novelty of this article lies in the HPC focused implementation of the algorithm, detailing how to fuse and combine the composing blocks to obtain an scalable MPI implementation. Such an implementation is mandatory in large scale cases, for which the contact surface cannot be stored in a single computational node, or the number of contact nodes is not negligible compared with the size of the domain.

中文翻译:

接口问题的HPC紧凑拟牛顿算法

摘要 在这项工作中,我们提出了一种称为紧凑接口拟牛顿 (CIQN) 的稳健接口耦合算法。它专为使用 MPI 多代码分区方案的计算密集型应用程序而设计。该算法允许重用来自先前时间步长的信息,这是先前提出的用于加速收敛的特征。通过代数操作,计算资源的有效利用是通过以下方式实现的:避免构建密集矩阵并将每次乘法减少为矩阵向量乘积,并重用计算成本高的循环。这导致原始拟牛顿算法的紧凑版本。连同高效的通信,在本文中,我们展示了高达 4800 个内核的高效可扩展性。三个具有不同动力学性质的例子证明了该算法可以有效地处理附加质量不稳定性和两场耦合问题。我们还展示了重用历史和过滤并不一定会产生更强大的方案,最后,我们证明了该算法的 HPC 版本的必要性。本文的新颖之处在于算法的 HPC 重点实现,详细介绍了如何融合和组合组合块以获得可扩展的 MPI 实现。这种实现在大规模情况下是强制性的,因为接触面不能存储在单个计算节点中,或者接触节点的数量与域的大小相比不可忽略。我们还展示了重用历史和过滤并不一定会产生更强大的方案,最后,我们证明了该算法的 HPC 版本的必要性。本文的新颖之处在于算法的 HPC 重点实现,详细介绍了如何融合和组合组合块以获得可扩展的 MPI 实现。这种实现在大规模情况下是强制性的,因为接触面不能存储在单个计算节点中,或者接触节点的数量与域的大小相比不可忽略。我们还展示了重用历史和过滤并不一定会产生更强大的方案,最后,我们证明了该算法的 HPC 版本的必要性。本文的新颖之处在于算法的 HPC 重点实现,详细介绍了如何融合和组合组合块以获得可扩展的 MPI 实现。这种实现在大规模情况下是强制性的,因为接触面不能存储在单个计算节点中,或者接触节点的数量与域的大小相比不可忽略。详细说明如何融合和组合组合块以获得可扩展的 MPI 实现。这种实现在大规模情况下是强制性的,因为接触面不能存储在单个计算节点中,或者接触节点的数量与域的大小相比不可忽略。详细说明如何融合和组合组合块以获得可扩展的 MPI 实现。这种实现在大规模情况下是强制性的,因为接触面不能存储在单个计算节点中,或者接触节点的数量与域的大小相比不可忽略。
更新日期:2020-07-01
down
wechat
bug