当前位置:
X-MOL 学术
›
arXiv.cs.ET
›
论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Energy-Efficient Moderate Precision Time-Domain Mixed-signal Vector-by-Matrix Multiplier Exploiting 1T-1R Arrays
arXiv - CS - Emerging Technologies Pub Date : 2019-05-23 , DOI: arxiv-1905.09454 Shubham Sahay, Mohammad Bavandpour, Mohammad Reza Mahmoodi, and Dmitri Strukov
arXiv - CS - Emerging Technologies Pub Date : 2019-05-23 , DOI: arxiv-1905.09454 Shubham Sahay, Mohammad Bavandpour, Mohammad Reza Mahmoodi, and Dmitri Strukov
The emerging mobile devices in this era of internet-of-things (IoT) require a
dedicated processor to enable computationally intensive applications such as
neuromorphic computing and signal processing. Vector-by-matrix multiplication
(VMM) is the most prominent operation in these applications. Therefore, there
is a critical need for compact and ultralow-power VMM blocks to perform
resource-intensive low-to-moderate precision computations. To this end, in this
work, for the first time, we propose a time-domain mixed-signal VMM exploiting
a modified configuration of 1MOSFET-1RRAM (1T-1R) array. The proposed VMM
overcomes the energy inefficiency of the current-mode VMM approaches based on
RRAMs. A rigorous analysis of the different non-ideal factors affecting the
computational precision indicates that the non-negligible minimum cell
currents, channel length modulation (CLM) and drain-induced barrier lowering
(DIBL) are the dominant mechanisms degrading the precision of the proposed VMM.
Our results also indicate that there exists a trade-off between the
computational precision, dynamic range, and the area- and energy-efficiency of
the proposed VMM approach. Therefore, we provide the necessary design
guidelines for optimizing the performance. Our preliminary results show that an
effective computational precision of 6-bits is achievable owing to an inherent
compensation effect in the modified 1T-1R blocks. Furthermore, a 4-bit 200x200
VMM utilizing the proposed approach exhibits a significantly high energy
efficiency of ~1.5 POps/J and a throughput of 2.5 TOps/s including the
contribution from the input/output (I/O) circuitry.
中文翻译:
利用 1T-1R 阵列的高能效中等精度时域混合信号矢量矩阵乘法器
在这个物联网 (IoT) 时代,新兴的移动设备需要专用处理器来支持神经形态计算和信号处理等计算密集型应用。向量矩阵乘法 (VMM) 是这些应用中最突出的运算。因此,迫切需要紧凑且超低功耗的 VMM 块来执行资源密集型的中低精度计算。为此,在这项工作中,我们首次提出了一种时域混合信号 VMM,它利用了 1MOSFET-1RRAM (1T-1R) 阵列的修改配置。所提出的 VMM 克服了基于 RRAM 的电流模式 VMM 方法的能源效率低下的问题。影响计算精度的不同的非理想因素的严格的分析表明,不可忽略的最小电池电流 通道长度调制 (CLM) 和漏极诱导势垒降低 (DIBL) 是降低所提出的 VMM 精度的主要机制。我们的结果还表明,所提出的 VMM 方法的计算精度、动态范围以及面积和能量效率之间存在权衡。因此,我们为优化性能提供了必要的设计指南。我们的初步结果表明,由于修改后的 1T-1R 块中的固有补偿效应,可以实现 6 位的有效计算精度。此外,利用所提出的方法的 4 位 200x200 VMM 具有~1.5 POps/J 的显着高能效和 2.5 TOps/s 的吞吐量,包括来自输入/输出 (I/O) 电路的贡献。以及提议的 VMM 方法的面积和能源效率。因此,我们为优化性能提供了必要的设计指南。我们的初步结果表明,由于修改后的 1T-1R 块中的固有补偿效应,可以实现 6 位的有效计算精度。此外,利用所提出的方法的 4 位 200x200 VMM 具有~1.5 POps/J 的显着高能效和 2.5 TOps/s 的吞吐量,包括来自输入/输出 (I/O) 电路的贡献。以及提议的 VMM 方法的面积和能源效率。因此,我们为优化性能提供了必要的设计指南。我们的初步结果表明,由于修改后的 1T-1R 块中的固有补偿效应,可以实现 6 位的有效计算精度。此外,利用所提出的方法的 4 位 200x200 VMM 具有~1.5 POps/J 的显着高能效和 2.5 TOps/s 的吞吐量,包括来自输入/输出 (I/O) 电路的贡献。
更新日期:2020-01-08
中文翻译:
利用 1T-1R 阵列的高能效中等精度时域混合信号矢量矩阵乘法器
在这个物联网 (IoT) 时代,新兴的移动设备需要专用处理器来支持神经形态计算和信号处理等计算密集型应用。向量矩阵乘法 (VMM) 是这些应用中最突出的运算。因此,迫切需要紧凑且超低功耗的 VMM 块来执行资源密集型的中低精度计算。为此,在这项工作中,我们首次提出了一种时域混合信号 VMM,它利用了 1MOSFET-1RRAM (1T-1R) 阵列的修改配置。所提出的 VMM 克服了基于 RRAM 的电流模式 VMM 方法的能源效率低下的问题。影响计算精度的不同的非理想因素的严格的分析表明,不可忽略的最小电池电流 通道长度调制 (CLM) 和漏极诱导势垒降低 (DIBL) 是降低所提出的 VMM 精度的主要机制。我们的结果还表明,所提出的 VMM 方法的计算精度、动态范围以及面积和能量效率之间存在权衡。因此,我们为优化性能提供了必要的设计指南。我们的初步结果表明,由于修改后的 1T-1R 块中的固有补偿效应,可以实现 6 位的有效计算精度。此外,利用所提出的方法的 4 位 200x200 VMM 具有~1.5 POps/J 的显着高能效和 2.5 TOps/s 的吞吐量,包括来自输入/输出 (I/O) 电路的贡献。以及提议的 VMM 方法的面积和能源效率。因此,我们为优化性能提供了必要的设计指南。我们的初步结果表明,由于修改后的 1T-1R 块中的固有补偿效应,可以实现 6 位的有效计算精度。此外,利用所提出的方法的 4 位 200x200 VMM 具有~1.5 POps/J 的显着高能效和 2.5 TOps/s 的吞吐量,包括来自输入/输出 (I/O) 电路的贡献。以及提议的 VMM 方法的面积和能源效率。因此,我们为优化性能提供了必要的设计指南。我们的初步结果表明,由于修改后的 1T-1R 块中的固有补偿效应,可以实现 6 位的有效计算精度。此外,利用所提出的方法的 4 位 200x200 VMM 具有~1.5 POps/J 的显着高能效和 2.5 TOps/s 的吞吐量,包括来自输入/输出 (I/O) 电路的贡献。