当前位置: X-MOL 学术Int. J. High Perform. Comput. Appl. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
I/O performance of the Santos Dumont supercomputer
The International Journal of High Performance Computing Applications ( IF 3.1 ) Pub Date : 2019-09-12 , DOI: 10.1177/1094342019868526
Jean Luca Bez 1 , André Ramos Carneiro 2 , Pablo José Pavan 1 , Valéria Soldera Girelli 1 , Francieli Zanon Boito 3 , Bruno Alves Fagundes 2 , Carla Osthoff 2 , Pedro Leite da Silva Dias 4 , Jean-François Méhaut 3 , Philippe OA Navaux 1
Affiliation  

In this article, we study the I/O performance of the Santos Dumont supercomputer, since the gap between processing and data access speeds causes many applications to spend a large portion of their execution on I/O operations. For a large-scale expensive supercomputer, it is essential to ensure applications achieve the best I/O performance to promote efficient usage. We monitor a week of the machine’s activity and present a detailed study on the obtained metrics, aiming at providing an understanding of its workload. From experiences with one numerical simulation, we identified large I/O performance differences between the MPI implementations available to users. We investigated the phenomenon and narrowed it down to collective I/O operations with small request sizes. For these, we concluded that the customized MPI implementation by the machine’s vendor (used by more than 20% of the jobs) presents the worst performance. By investigating the issue, we provide information to help improve future MPI-IO collective write implementations and practical guidelines to help users and steer future system upgrades. Finally, we discuss the challenge of describing applications I/O behavior without depending on information from users. That allows for identifying the application’s I/O bottlenecks and proposing ways of improving its I/O performance. We propose a methodology to do so, and use GROMACS, the application with the largest number of jobs in 2017, as a case study.

中文翻译:

Santos Dumont 超级计算机的 I/O 性能

在本文中,我们研究了 Santos Dumont 超级计算机的 I/O 性能,因为处理速度和数据访问速度之间的差距导致许多应用程序将大部分执行时间花在 I/O 操作上。对于大型昂贵的超级计算机,确保应用程序实现最佳 I/O 性能以促进高效使用至关重要。我们监控机器一周的活动,并对获得的指标进行详细研究,旨在了解其工作负载。根据一次数值模拟的经验,我们确定了用户可用的 MPI 实现之间存在很大的 I/O 性能差异。我们调查了这一现象,并将其范围缩小到请求规模较小的集体 I/O 操作。对于这些,我们得出结论,机器供应商的定制 MPI 实现(被超过 20% 的作业使用)表现出最差的性能。通过调查该问题,我们提供信息以帮助改进未来的 MPI-IO 集体写入实现和实用指南,以帮助用户和引导未来的系统升级。最后,我们讨论了在不依赖用户信息的情况下描述应用程序 I/O 行为的挑战。这允许识别应用程序的 I/O 瓶颈并提出改进其 I/O 性能的方法。我们提出了一种方法来做到这一点,并使用 GROMACS 作为案例研究,GROMACS 是 2017 年工作数量最多的应用程序。我们提供信息以帮助改进未来的 MPI-IO 集体写入实现和实用指南,以帮助用户和指导未来的系统升级。最后,我们讨论了在不依赖用户信息的情况下描述应用程序 I/O 行为的挑战。这允许识别应用程序的 I/O 瓶颈并提出改进其 I/O 性能的方法。我们提出了一种方法来做到这一点,并使用 GROMACS 作为案例研究,GROMACS 是 2017 年工作数量最多的应用程序。我们提供信息以帮助改进未来的 MPI-IO 集体写入实现和实用指南,以帮助用户和指导未来的系统升级。最后,我们讨论了在不依赖用户信息的情况下描述应用程序 I/O 行为的挑战。这允许识别应用程序的 I/O 瓶颈并提出改进其 I/O 性能的方法。我们提出了一种方法来做到这一点,并使用 GROMACS 作为案例研究,GROMACS 是 2017 年工作数量最多的应用程序。
更新日期:2019-09-12
down
wechat
bug