当前位置: X-MOL 学术J. Syst. Archit. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Experiment and enabled flow for GPGPU-Sim simulators with fixed-point instructions
Journal of Systems Architecture ( IF 4.5 ) Pub Date : 2020-04-29 , DOI: 10.1016/j.sysarc.2020.101783
Chao-Lin Lee , Min-Yih Hsu , Bing-Sung Lu , Ming-Yu Hung , Jenq-Kuen Lee

Currently, GPGPU-Sim has become an important vehicle for academic architecture research. It is a cycle-accurate simulator that models the contemporary graphics processing unit. Machine learning has now been widely used in various applications such as self-driving car, mobile devices, and medication. With the popularity of mobile devices, mobile vendors are interested on porting machine learning or deep learning applications from computers to mobile devices. Google has developed TensorFlow Lite and Android NNAPI for mobile and embedded devices. Since machine learning and deep learning are very computationally intensive, the energy consumption has become a serious problem in mobile devices. Moreover, Moore’s law cannot last forever. Hence, the performance of the mobile device and computers such as desktops or servers will have limited enhancements in the foreseeable future. Therefore, the performance and the energy consumption are two issues of great concern. In this paper, we proposed a new data type, fixed-point, which is a low-power numerical data type that can reduce energy consumption and enhance performance in machine learning applications. We implemented the fixed-point instructions in the GPGPU-Sim simulator and observed the energy consumption and performance. Our evaluation demonstrates that by using the fixed-point instructions, the proposed design exhibits improved energy savings. Our experiment indicate that the use of fixed-point data type saves at least 14% of total GPU energy consumption than floating-point data type.



中文翻译:

使用定点指令进行GPGPU-Sim模拟器的实验和启用的流程

目前,GPGPU-Sim已成为学术架构研究的重要工具。这是一个精确的周期模拟器,用于模拟当代图形处理单元。机器学习现已广泛用于各种应用中,例如自动驾驶汽车,移动设备和药物。随着移动设备的普及,移动供应商对将机器学习或深度学习应用程序从计算机移植到移动设备感兴趣。谷歌已经为移动和嵌入式设备开发了TensorFlow Lite和Android NNAPI。由于机器学习和深度学习的计算量很大,因此能耗已成为移动设备中的严重问题。而且,摩尔定律不可能永远持续下去。因此,在可预见的将来,移动设备和计算机(如台式机或服务器)的性能将有限地增强。因此,性能和能耗是两个令人关注的问题。在本文中,我们提出了一种新的数据类型,即定点数据,这是一种低功耗的数值数据类型,可以减少能耗并提高机器学习应用程序的性能。我们在GPGPU-Sim模拟器中实现了定点指令,并观察了能耗和性能。我们的评估表明,通过使用定点指令,所提出的设计具有更好的节能效果。我们的实验表明,使用定点数据类型比使用浮点数据类型至少可节省GPU总能耗的14%。性能和能耗是两个非常值得关注的问题。在本文中,我们提出了一种新的数据类型,即定点数据,这是一种低功耗的数值数据类型,可以减少能耗并提高机器学习应用程序的性能。我们在GPGPU-Sim模拟器中实现了定点指令,并观察了能耗和性能。我们的评估表明,通过使用定点指令,所提出的设计具有更好的节能效果。我们的实验表明,使用定点数据类型比使用浮点数据类型至少可节省GPU总能耗的14%。性能和能耗是两个非常值得关注的问题。在本文中,我们提出了一种新的数据类型,即定点数据,这是一种低功耗数值数据类型,可以减少能耗并提高机器学习应用程序的性能。我们在GPGPU-Sim模拟器中实现了定点指令,并观察了能耗和性能。我们的评估表明,通过使用定点指令,所提出的设计具有更好的节能效果。我们的实验表明,使用定点数据类型比使用浮点数据类型至少可节省GPU总能耗的14%。这是一种低功耗数值数据类型,可以减少能耗并提高机器学习应用程序的性能。我们在GPGPU-Sim模拟器中实现了定点指令,并观察了能耗和性能。我们的评估表明,通过使用定点指令,所提出的设计具有更好的节能效果。我们的实验表明,使用定点数据类型比使用浮点数据类型至少可节省GPU总能耗的14%。这是一种低功耗数值数据类型,可以减少能耗并提高机器学习应用程序的性能。我们在GPGPU-Sim模拟器中实现了定点指令,并观察了能耗和性能。我们的评估表明,通过使用定点指令,所提出的设计具有更好的节能效果。我们的实验表明,使用定点数据类型比使用浮点数据类型至少可节省GPU总能耗的14%。

更新日期:2020-04-29
down
wechat
bug