当前位置: X-MOL 学术J. Real-Time Image Proc. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Towards SSD accelerating for embedded environments: a compressive sensing based approach
Journal of Real-Time Image Processing ( IF 2.9 ) Pub Date : 2022-09-28 , DOI: 10.1007/s11554-022-01255-7
Imene Bouderbal , Abdenour Amamra , M. El-Arbi Djebbar , M. Akrem Benatia

Since the rise of convolutional neural networks (CNN), deep learning-based computer vision has been a dynamic field of research. Nevertheless, modern CNN architectures have not given sufficient consideration to real−time applications within limited computation settings and always compromise speed and accuracy. To this end, a novel approach to CNN design, based on the emerging technology of compressive sensing (CS), is proposed. For instance, CS networks function in a compression−reconstruction approach as an encoder−decoder neural network. This approach transforms the computer vision problem into a multioutput learning problem by incorporating the CS network into a recognition network for joint training. As to the deployment phase, images are obtained from a CS−acquisition device and fed directly, without reconstruction, to the new recognition network. Following such an approach considerably improves transmission bandwidth and reduces the computational burden. Furthermore, the redesigned CNN holds fewer parameters than its original counterpart, thus reducing model complexity. To validate our findings, object detection using the Single−Shot Detector (SSD) network was redesigned to operate in our CS−based ecosystem using different datasets. The results show that the lightweight CS network offers good performance at a faster running speed. For instance, the number of FLOPS was reduced by 57% compared to the SSD baseline. Furthermore, the proposed CS_SSD achieves a compelling accuracy while being 30% faster than its original counterpart on small GPUs. Code is available at: https://github.com/Bouderbal-Imene/CS-SSD.



中文翻译:

面向嵌入式环境的 SSD 加速:基于压缩传感的方法

自卷积神经网络 (CNN) 兴起以来,基于深度学习的计算机视觉一直是一个动态的研究领域。然而,现代 CNN 架构并没有充分考虑有限计算设置内的实时应用程序,并且总是会影响速度和准确性。为此,提出了一种基于新兴压缩感知 (CS) 技术的 CNN 设计新方法。例如,CS 网络以压缩-重建方法作为编码器-解码器神经网络发挥作用。这种方法通过将 CS 网络合并到识别网络中进行联合训练,将计算机视觉问题转化为多输出学习问题。至于部署阶段,图像从 CS 采集设备获得并直接馈送,无需重建,到新的识别网络。遵循这种方法可以显着提高传输带宽并减少计算负担。此外,重新设计的 CNN 比其原始版本拥有更少的参数,从而降低了模型的复杂性。为了验证我们的发现,使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。遵循这种方法可以显着提高传输带宽并减少计算负担。此外,重新设计的 CNN 比其原始版本拥有更少的参数,从而降低了模型的复杂性。为了验证我们的发现,使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。遵循这种方法可以显着提高传输带宽并减少计算负担。此外,重新设计的 CNN 比其原始版本拥有更少的参数,从而降低了模型的复杂性。为了验证我们的发现,使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。重新设计的 CNN 比原来的 CNN 拥有更少的参数,从而降低了模型的复杂性。为了验证我们的发现,使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。重新设计的 CNN 比原来的 CNN 拥有更少的参数,从而降低了模型的复杂性。为了验证我们的发现,使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。使用 Single-Shot Detector (SSD) 网络的对象检测被重新设计为在我们基于 CS 的生态系统中使用不同的数据集进行操作。结果表明,轻量级 CS 网络以更快的运行速度提供了良好的性能。例如,与 SSD 基线相比,FLOPS 的数量减少了 57%。此外,所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。所提出的 CS_SSD 实现了令人信服的精度,同时比其在小型 GPU 上的原始对应物快 30%。代码位于:https://github.com/Bouderbal-Imene/CS-SSD。

更新日期:2022-09-28
down
wechat
bug