当前位置:
X-MOL 学术
›
arXiv.cs.DC
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
FPGA-based Near-Memory Acceleration of Modern Data-Intensive Applications
arXiv - CS - Distributed, Parallel, and Cluster Computing Pub Date : 2021-06-11 , DOI: arxiv-2106.06433 Gagandeep Singh, Mohammed Alser, Damla Senol Cali, Dionysios Diamantopoulos, Juan Gómez-Luna, Henk Corporaal, Onur Mutlu
arXiv - CS - Distributed, Parallel, and Cluster Computing Pub Date : 2021-06-11 , DOI: arxiv-2106.06433 Gagandeep Singh, Mohammed Alser, Damla Senol Cali, Dionysios Diamantopoulos, Juan Gómez-Luna, Henk Corporaal, Onur Mutlu
Modern data-intensive applications demand high computation capabilities with
strict power constraints. Unfortunately, such applications suffer from a
significant waste of both execution cycles and energy in current computing
systems due to the costly data movement between the computation units and the
memory units. Genome analysis and weather prediction are two examples of such
applications. Recent FPGAs couple a reconfigurable fabric with high-bandwidth
memory (HBM) to enable more efficient data movement and improve overall
performance and energy efficiency. This trend is an example of a paradigm shift
to near-memory computing. We leverage such an FPGA with high-bandwidth memory
(HBM) for improving the pre-alignment filtering step of genome analysis and
representative kernels from a weather prediction model. Our evaluation
demonstrates large speedups and energy savings over a high-end IBM POWER9
system and a conventional FPGA board with DDR4 memory. We conclude that
FPGA-based near-memory computing has the potential to alleviate the data
movement bottleneck for modern data-intensive applications.
中文翻译:
现代数据密集型应用的基于 FPGA 的近内存加速
现代数据密集型应用程序需要具有严格功率限制的高计算能力。不幸的是,由于计算单元和存储器单元之间的数据移动成本高昂,这些应用程序在当前计算系统中遭受了执行周期和能量的显着浪费。基因组分析和天气预报是此类应用的两个示例。最近的 FPGA 将可重配置结构与高带宽存储器 (HBM) 相结合,以实现更高效的数据移动并提高整体性能和能效。这种趋势是向近内存计算的范式转变的一个例子。我们利用这种具有高带宽存储器 (HBM) 的 FPGA 来改进基因组分析的预对齐过滤步骤和来自天气预报模型的代表性内核。我们的评估表明,与高端 IBM POWER9 系统和具有 DDR4 内存的传统 FPGA 板相比,可以实现大幅加速和节能。我们得出的结论是,基于 FPGA 的近内存计算有可能缓解现代数据密集型应用程序的数据移动瓶颈。
更新日期:2021-06-14
中文翻译:
现代数据密集型应用的基于 FPGA 的近内存加速
现代数据密集型应用程序需要具有严格功率限制的高计算能力。不幸的是,由于计算单元和存储器单元之间的数据移动成本高昂,这些应用程序在当前计算系统中遭受了执行周期和能量的显着浪费。基因组分析和天气预报是此类应用的两个示例。最近的 FPGA 将可重配置结构与高带宽存储器 (HBM) 相结合,以实现更高效的数据移动并提高整体性能和能效。这种趋势是向近内存计算的范式转变的一个例子。我们利用这种具有高带宽存储器 (HBM) 的 FPGA 来改进基因组分析的预对齐过滤步骤和来自天气预报模型的代表性内核。我们的评估表明,与高端 IBM POWER9 系统和具有 DDR4 内存的传统 FPGA 板相比,可以实现大幅加速和节能。我们得出的结论是,基于 FPGA 的近内存计算有可能缓解现代数据密集型应用程序的数据移动瓶颈。