当前位置: X-MOL 学术Sci. Program. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Three Strategies for Improving Shortest Vector Enumeration Using GPUs
Scientific Programming Pub Date : 2021-01-05 , DOI: 10.1155/2021/8852497
Mohamed S. Esseissah 1 , Ashraf Bhery 1 , Sameh S. Daoud 1 , Hatem M. Bahig 1
Affiliation  

Hard Lattice problems are assumed to be one of the most promising problems for generating cryptosystems that are secure in quantum computing. The shortest vector problem (SVP) is one of the most famous lattice problems. In this paper, we present three improvements on GPU-based parallel algorithms for solving SVP using the classical enumeration and pruned enumeration. There are two improvements for preprocessing: we use a combination of randomization and the Gaussian heuristic to expect a better basis that leads rapidly to a shortest vector and we expect the level on which the exchanging data between CPU and GPU is optimized. In the third improvement, we improve GPU-based implementation by generating some points in GPU rather than in CPU. We used NVIDIA GeForce GPUs of type GTX 1060 6G. We achieved a significant improvement upon Hermans’s improvement. The improvements speed up the pruned enumeration by a factor of almost 2.5 using a single GPU. Additionally, we provided an implementation for multi-GPUs by using two GPUs. The results showed that our algorithm of enumeration is scalable since the speedups achieved using two GPUs are almost faster than Hermans’s improvement by a factor of almost 5. The improvements also provided a high speedup for the classical enumeration. The speedup achieved using our improvements and two GPUs on a challenge of dimension 60 is almost faster by factor 2 than Correia’s parallel implementation using a dual-socket machine with 16 physical cores and simultaneous multithreading technology.

中文翻译:

使用GPU改善最短向量枚举的三种策略

硬格子问题被认为是生成在量子计算中安全的密码系统的最有希望的问题之一。最短向量问题(SVP)是最著名的晶格问题之一。在本文中,我们对基于GPU的并行算法(使用经典枚举和修剪枚举来求解SVP)进行了三处改进。预处理有两个改进:我们结合使用了随机化和高斯启发式算法,期望有一个更好的基础可以迅速导致最短的向量,并且我们希望可以优化CPU和GPU之间的数据交换水平。在第三项改进中,我们通过在GPU中而不是CPU中生成一些点来改进基于GPU的实现。我们使用了GTX 1060 6G类型的NVIDIA GeForce GPU。我们在Hermans的改进上取得了重大进步。使用单个GPU的改进将修剪的枚举速度提高了近2.5倍。此外,我们通过使用两个GPU提供了针对多GPU的实现。结果表明,我们的枚举算法具有可扩展性,因为使用两个GPU所实现的加速几乎比Hermans的改进快了将近5倍。这些改进还为经典枚举提供了很高的加速比。与Correia的使用具有16个物理内核的双插槽计算机和同步多线程技术的并行实施相比,使用我们的改进和两个GPU应对60尺寸的速度几乎快了2倍。我们通过使用两个GPU提供了针对多GPU的实现。结果表明,我们的枚举算法具有可扩展性,因为使用两个GPU所实现的加速几乎比Hermans的改进快了将近5倍。这些改进还为经典枚举提供了很高的加速比。与Correia的使用具有16个物理内核的双插槽计算机和同步多线程技术的并行实施相比,使用我们的改进和两个GPU应对60尺寸的速度几乎快了2倍。我们通过使用两个GPU提供了针对多GPU的实现。结果表明,我们的枚举算法具有可扩展性,因为使用两个GPU所实现的加速几乎比Hermans的改进快了将近5倍。这些改进还为经典枚举提供了很高的加速比。与Correia的使用具有16个物理内核的双插槽计算机和同步多线程技术的并行实施相比,使用我们的改进和两个GPU应对60尺寸的速度几乎快了2倍。这些改进还为经典枚举提供了很高的速度。与Correia的使用具有16个物理内核的双插槽计算机和同步多线程技术的并行实施相比,使用我们的改进和两个GPU应对60尺寸的速度几乎快了2倍。这些改进还为经典枚举提供了很高的速度。与Correia的使用具有16个物理内核的双插槽计算机和同步多线程技术的并行实施相比,使用我们的改进和两个GPU应对60尺寸的速度几乎快了2倍。
更新日期:2021-01-05
down
wechat
bug