当前位置: X-MOL 学术arXiv.cs.AR › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
F1: A Fast and Programmable Accelerator for Fully Homomorphic Encryption (Extended Version)
arXiv - CS - Hardware Architecture Pub Date : 2021-09-11 , DOI: arxiv-2109.05371
Axel Feldmann, Nikola Samardzic, Aleksandar Krastev, Srini Devadas, Ron Dreslinski, Karim Eldefrawy, Nicholas Genise, Christopher Peikert, Daniel Sanchez

Fully Homomorphic Encryption (FHE) allows computing on encrypted data, enabling secure offloading of computation to untrusted serves. Though it provides ideal security, FHE is expensive when executed in software, 4 to 5 orders of magnitude slower than computing on unencrypted data. These overheads are a major barrier to FHE's widespread adoption. We present F1, the first FHE accelerator that is programmable, i.e., capable of executing full FHE programs. F1 builds on an in-depth architectural analysis of the characteristics of FHE computations that reveals acceleration opportunities. F1 is a wide-vector processor with novel functional units deeply specialized to FHE primitives, such as modular arithmetic, number-theoretic transforms, and structured permutations. This organization provides so much compute throughput that data movement becomes the bottleneck. Thus, F1 is primarily designed to minimize data movement. The F1 hardware provides an explicitly managed memory hierarchy and mechanisms to decouple data movement from execution. A novel compiler leverages these mechanisms to maximize reuse and schedule off-chip and on-chip data movement. We evaluate F1 using cycle-accurate simulations and RTL synthesis. F1 is the first system to accelerate complete FHE programs and outperforms state-of-the-art software implementations by gmean 5400x and by up to 17000x. These speedups counter most of FHE's overheads and enable new applications, like real-time private deep learning in the cloud.

中文翻译:

F1:用于全同态加密的快速可编程加速器(扩展版)

全同态加密 (FHE) 允许对加密数据进行计算,从而将计算安全卸载到不受信任的服务。虽然它提供了理想的安全性,但在软件中执行时 FHE 很昂贵,比计算未加密数据慢 4 到 5 个数量级。这些开销是 FHE 广泛采用的主要障碍。我们展示了 F1,这是第一个可编程的 FHE 加速器,即能够执行完整的 FHE 程序。F1 建立在对 FHE 计算特征的深入架构分析的基础上,该分析揭示了加速机会。F1 是一种宽向量处理器,具有深度专用于 FHE 原语的新颖功能单元,例如模算术、数论变换和结构化排列。这种组织提供了如此多的计算吞吐量,以至于数据移动成为瓶颈。因此,F1 的主要设计目的是最大限度地减少数据移动。F1 硬件提供了显式管理的内存层次结构和机制,以将数据移动与执行分离。一种新颖的编译器利用这些机制来最大限度地重用并安排片外和片上数据移动。我们使用周期精确模拟和 RTL 综合评估 F1。F1 是第一个加速完整 FHE 程序的系统,其性能优于最先进的软件实施,gmean 为 5400 倍,最高可达 17000 倍。这些加速抵消了 FHE 的大部分开销并启用了新的应用程序,例如云中的实时私有深度学习。F1 硬件提供了显式管理的内存层次结构和机制,以将数据移动与执行分离。一种新颖的编译器利用这些机制来最大限度地重用并安排片外和片上数据移动。我们使用周期精确模拟和 RTL 综合评估 F1。F1 是第一个加速完整 FHE 程序的系统,其性能优于最先进的软件实施,gmean 为 5400 倍,最高可达 17000 倍。这些加速抵消了 FHE 的大部分开销并启用了新的应用程序,例如云中的实时私有深度学习。F1 硬件提供了显式管理的内存层次结构和机制,以将数据移动与执行分离。一种新颖的编译器利用这些机制来最大限度地重用并安排片外和片上数据移动。我们使用周期精确模拟和 RTL 综合评估 F1。F1 是第一个加速完整 FHE 程序的系统,其性能优于最先进的软件实施,gmean 为 5400 倍,最高可达 17000 倍。这些加速抵消了 FHE 的大部分开销并启用了新的应用程序,例如云中的实时私有深度学习。F1 是第一个加速完整 FHE 程序的系统,其性能优于最先进的软件实施,gmean 为 5400 倍,最高可达 17000 倍。这些加速抵消了 FHE 的大部分开销并启用了新的应用程序,例如云中的实时私有深度学习。F1 是第一个加速完整 FHE 程序的系统,其性能优于最先进的软件实施,gmean 为 5400 倍,最高可达 17000 倍。这些加速抵消了 FHE 的大部分开销并启用了新的应用程序,例如云中的实时私有深度学习。
更新日期:2021-09-14
down
wechat
bug