当前位置: X-MOL 学术Proc. IEEE › 论文详情
Tensor Methods in Computer Vision and Deep Learning
Proceedings of the IEEE ( IF 10.252 ) Pub Date : 2021-04-30 , DOI: 10.1109/jproc.2021.3074329
Yannis Panagakis, Jean Kossaifi, Grigorios G. Chrysos, James Oldfield, Mihalis A. Nicolaou, Anima Anandkumar, Stefanos Zafeiriou

Tensors, or multidimensional arrays, are data structures that can naturally represent visual data of multiple dimensions. Inherently able to efficiently capture structured, latent semantic spaces and high-order interactions, tensors have a long history of applications in a wide span of computer vision problems. With the advent of the deep learning paradigm shift in computer vision, tensors have become even more fundamental. Indeed, essential ingredients in modern deep learning architectures, such as convolutions and attention mechanisms, can readily be considered as tensor mappings. In effect, tensor methods are increasingly finding significant applications in deep learning, including the design of memory and compute efficient network architectures, improving robustness to random noise and adversarial attacks, and aiding the theoretical understanding of deep networks. This article provides an in-depth and practical review of tensors and tensor methods in the context of representation learning and deep learning, with a particular focus on visual data analysis and computer vision applications. Concretely, besides fundamental work in tensor-based visual data analysis methods, we focus on recent developments that have brought on a gradual increase in tensor methods, especially in deep learning architectures and their implications in computer vision applications. To further enable the newcomer to grasp such concepts quickly, we provide companion Python notebooks, covering key aspects of this article and implementing them, step-by-step with TensorLy.

中文翻译:

计算机视觉和深度学习中的张量方法

张量或多维数组是自然可以表示多维视觉数据的数据结构。张量固有地能够有效地捕获结构化的,潜在的语义空间和高阶交互,因此在广泛的计算机视觉问题中有着悠久的应用历史。随着计算机视觉中深度学习范式的转变,张量变得更加基础。确实,现代深度学习体系结构中的基本要素,例如卷积和注意力机制,可以很容易地视为张量映射。实际上,张量方法正逐渐在深度学习中找到重要的应用,包括内存设计和高效的网络架构,提高对随机噪声和对抗性攻击的鲁棒性,并有助于对深度网络的理论理解。本文在表示学习和深度学习的上下文中对张量和张量方法进行了深入而实用的评论,特别着重于视觉数据分析和计算机视觉应用。具体而言,除了基于张量的视觉数据分析方法的基础工作之外,我们还将关注最近的发展,这些发展已使张量方法(尤其是深度学习体系结构及其在计算机视觉应用中的意义)逐渐增加。为了进一步使新手能够快速掌握这些概念,我们提供了随附的Python笔记本,涵盖了本文的关键方面并与TensorLy一起逐步实现了这些笔记本。本文在表示学习和深度学习的上下文中对张量和张量方法进行了深入而实用的评论,特别着重于视觉数据分析和计算机视觉应用。具体而言,除了基于张量的视觉数据分析方法的基础工作之外,我们还将关注最近的发展,这些发展已使张量方法(尤其是深度学习体系结构及其在计算机视觉应用中的意义)逐渐增加。为了进一步使新手能够快速掌握这些概念,我们提供了随附的Python笔记本,涵盖了本文的关键方面并与TensorLy一起逐步实现了这些笔记本。本文在表示学习和深度学习的上下文中对张量和张量方法进行了深入而实用的评论,特别着重于视觉数据分析和计算机视觉应用。具体而言,除了基于张量的视觉数据分析方法的基础工作之外,我们还将关注最近的发展,这些发展已使张量方法(尤其是深度学习体系结构及其在计算机视觉应用中的意义)逐渐增加。为了进一步使新手能够快速掌握这些概念,我们提供了随附的Python笔记本,涵盖了本文的关键方面并与TensorLy一起逐步实现了这些笔记本。除了基于张量的视觉数据分析方法的基础工作之外,我们还将关注于最近的发展,这些发展使张量方法(尤其是深度学习体系结构及其在计算机视觉应用中的意义)逐渐增加。为了进一步使新手能够快速掌握这些概念,我们提供了随附的Python笔记本,涵盖了本文的关键方面并与TensorLy一起逐步实现了这些笔记本。除了基于张量的视觉数据分析方法的基础工作之外,我们还将关注于最近的发展,这些发展使张量方法(尤其是深度学习体系结构及其在计算机视觉应用中的意义)逐渐增加。为了进一步使新手能够快速掌握这些概念,我们提供了随附的Python笔记本,涵盖了本文的关键方面并与TensorLy一起逐步实现了这些笔记本。
更新日期:2021-05-04
全部期刊列表>>
专攻离子通道生理学研究
2021中国学者有奖调研
JACS
中国作者高影响力研究精选
虚拟特刊
屿渡论文,编辑服务
浙大
上海中医药大学
南方科技大学
舒伟
季恒星
毛凌玲
灵长脑研究中心
上海交大
朱如意
中科院
南开大学
隐藏1h前已浏览文章
课题组网站
新版X-MOL期刊搜索和高级搜索功能介绍
ACS材料视界
华辉
天合科研
x-mol收录
试剂库存
down
wechat
bug