当前位置: X-MOL 学术arXiv.cs.MS › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A generic finite element framework on parallel tree-based adaptive meshes
arXiv - CS - Mathematical Software Pub Date : 2019-07-08 , DOI: arxiv-1907.03709
Santiago Badia, Alberto F. Mart\'in, Eric Neiva, Francesc Verdugo

In this work we formally derive and prove the correctness of the algorithms and data structures in a parallel, distributed-memory, generic finite element framework that supports h-adaptivity on computational domains represented as forest-of-trees. The framework is grounded on a rich representation of the adaptive mesh suitable for generic finite elements that is built on top of a low-level, light-weight forest-of-trees data structure handled by a specialized, highly parallel adaptive meshing engine, for which we have identified the requirements it must fulfill to be coupled into our framework. Atop this two-layered mesh representation, we build the rest of data structures required for the numerical integration and assembly of the discrete system of linear equations. We consider algorithms that are suitable for both subassembled and fully-assembled distributed data layouts of linear system matrices. The proposed framework has been implemented within the FEMPAR scientific software library, using p4est as a practical forest-of-octrees demonstrator. A strong scaling study of this implementation when applied to Poisson and Maxwell problems reveals remarkable scalability up to 32.2K CPU cores and 482.2M degrees of freedom. Besides, a comparative performance study of FEMPAR and the state-of-the-art deal.ii finite element software shows at least comparative performance, and at most factor 2-3 improvements in the h-adaptive approximation of a Poisson problem with first- and second-order Lagrangian finite elements, respectively.

中文翻译:

基于并行树的自适应网格的通用有限元框架

在这项工作中,我们正式推导出并证明了并行、分布式内存、通用有限元框架中算法和数据结构的正确性,该框架支持表示为森林的计算域上的 h 自适应性。该框架基于适用于通用有限元的自适应网格的丰富表示,该网格建立在由专门的、高度并行的自适应网格划分引擎处理的低级、轻量级的森林数据结构之上,用于我们已经确定了它必须满足的要求才能耦合到我们的框架中。在这个两层网格表示之上,我们构建了离散线性方程组的数值积分和组装所需的其余数据结构。我们考虑适用于线性系统矩阵的子组装和完全组装分布式数据布局的算法。提议的框架已在 FEMPAR 科学软件库中实现,使用 p4est 作为实用的八叉树森林演示器。当应用于泊松和麦克斯韦问题时,对该实现的强大扩展研究揭示了高达 32.2K CPU 内核和 482.2M 自由度的卓越可扩展性。此外,对 FEMPAR 和最先进的 deal.ii 有限元软件的比较性能研究显示出至少具有比较性能,并且在泊松问题的 h 自适应逼近中最多提高了 2-3 倍和二阶拉格朗日有限元,分别。提议的框架已在 FEMPAR 科学软件库中实现,使用 p4est 作为实用的八叉树森林演示器。当应用于泊松和麦克斯韦问题时,对该实现的强大扩展研究揭示了高达 32.2K CPU 内核和 482.2M 自由度的卓越可扩展性。此外,对 FEMPAR 和最先进的 deal.ii 有限元软件的比较性能研究显示出至少具有比较性能,并且在泊松问题的 h 自适应逼近中最多提高了 2-3 倍和二阶拉格朗日有限元,分别。提议的框架已在 FEMPAR 科学软件库中实现,使用 p4est 作为实用的八叉树森林演示器。当应用于泊松和麦克斯韦问题时,对该实现的强大扩展研究揭示了高达 32.2K CPU 内核和 482.2M 自由度的卓越可扩展性。此外,对 FEMPAR 和最先进的 deal.ii 有限元软件的比较性能研究显示出至少具有比较性能,并且在泊松问题的 h 自适应逼近中最多提高了 2-3 倍和二阶拉格朗日有限元,分别。当应用于泊松和麦克斯韦问题时,对该实现的强大扩展研究揭示了高达 32.2K CPU 内核和 482.2M 自由度的卓越可扩展性。此外,对 FEMPAR 和最先进的 deal.ii 有限元软件的比较性能研究显示出至少具有比较性能,并且在泊松问题的 h 自适应逼近中最多提高了 2-3 倍和二阶拉格朗日有限元,分别。当应用于泊松和麦克斯韦问题时,对该实现的强大扩展研究揭示了高达 32.2K CPU 内核和 482.2M 自由度的卓越可扩展性。此外,对 FEMPAR 和最先进的 deal.ii 有限元软件的比较性能研究显示出至少具有比较性能,并且在泊松问题的 h 自适应逼近中最多提高了 2-3 倍和二阶拉格朗日有限元,分别。
更新日期:2020-04-10
down
wechat
bug