大数据文摘出品
记者:曹培信
AI发展的基础是算力,而算力的基础是芯片。
在2007年以前,由于算法和数据的限制,这一阶段AI并没有形成成熟的发展,因此对于芯片并也没有特别强烈的需求,通用的CPU芯片即可提供足够的计算能力。
之后,出于高清视频、游戏行业的需求,GPU取得突破,同时AI研究者们也发现GPU有更多的逻辑运算单元用于处理数据,属于高并行结构,在处理图形数据和复杂算法方面比CPU更有优势,而AI深度学习的模型有着参数多、数据规模大、计算量大的特点,因此此后一段时间内GPU代替了CPU,成为当时AI芯片的主流。
2010年后,云计算广泛推广,AI研究人员可以通过云计算借助大量CPU和GPU进行混合运算。
2012年之后,AI模型更新迭代迅速加快,AI对芯片的算力需求也愈发强烈,因此进入2015年后,业界开始研发针对人工智能的专用芯片,希望通过更好的硬件和芯片架构,在计算效率上进一步带来10倍的提升。
半导体设计周期远落后于AI模型更新
今天是2019赛灵思开发者大会(XDF2019)的第一天,赛灵思负责软件、IP和AI方案的副总裁Ramine Roane先生在记者见面会上表示:“现在,每三个月AI模型就要变一次,工程师想建立一个ASIC或GPU需花要一年半时间设计硅芯片,半导体的设计周期远远大于AI模型更替周期。”
Roane指出,如果使用硅芯片实现这些AI模型,很有可能在硅芯片设计好的时候,AI模型早已经更替。
目前AI芯片领域解决这个问题的方法有这么几种:
一是针对深度学习算法的全定制人工智能芯片,这包括谷歌的TPU芯片、我国中科院计算所的寒武纪深度学习处理器芯片等;
二是类脑计算芯片,试图通过模仿人脑结构来提高存储密度,但是目前还没有能够支撑这种结构的成熟技术;
还有一种便是基于FPGA的半定制人工智能芯片,目前FPGA芯片市场被赛灵思(Xilinx)和Altera瓜分,据国外媒体Marketwatch的统计,前者占全球市场份额50%、后者占35%左右。
硬件产商转向软件平台,Vitis AI今日起提供下载
尽管FPGA芯片被称为“万能芯片”,用户可以通过烧入配置文件使FPGA内部的硬件电路有确定的连接方式,具有特定的功能,输入的数据只需要依次经过各个门电路,就可以得到输出结果。
但是这种方式对于只想开发调试模型、不想管硬件的AI工程师们,并不是太友好。
意识到软件工程师数量远大于硬件工程师的赛灵思,在十月初的北美开发者论坛上,推出了统一软件平台Vitis,加快了进入软件市场的步伐,并且在今天的大会上宣布:Vitis AI提供下载。
Vitis AI是Xilinx的AI开发平台,适用于在Xilinx硬件平台(包括边缘设备和Alveo卡)上进行人工智能推断。它由优化的 IP、工具、库、模型和示例设计组成。Vitis AI试图做到高效易用,并且可以在自己耕耘已久的FPGA和ACAP上充分发挥人工智能加速的潜力。
Vitis AI支持目前的主流框架,比如TensorFlow、Pytorch,能够执行不同的深度学习任务。
同时开源的内容还包括了优化的 IP、工具、库、模型和示例设计组成。其开源的8个库里包括了400多项功能的包,从里面拿出现成的代码删删减减就能实现自己需要的功能,这对现在的AI研究者来说还是很有吸引力的。
其自适应加速平台结构如下:
红色部分的FPGA结构,可以用于定制的逻辑/内存;
绿色部分的有矢量处理器,矢量处理器适合高度流水线作业的处理器,做AI加速更有效,擅长做算数、矩阵,主要用于AI运算。
蓝色部分可以嵌入ARM内核子系统
黄色部分的片上个网络,用于将不同架构连接起来。
“它看起来像FPGA,也是阵列式排布,但里面包含小的DSP处理器,形成DSP和FPGA的混合体,从而实现可配置的数据流。”Ramin指出。
当记者问到完全开源的软件平台如何盈利时,Ramin表示,赛灵思的盈利还是依靠硬件。
如此看来,赛灵思在看到AI的迅速发展后,似乎想通过Vitis AI吸引AI开发者,扩大在AI领域的影响力进一步为其FPGA芯片开拓市场。
积极与中国企业合作,看好中国市场
在谈到中国市场时,Ramin表示赛灵思一直很注重中国市场,认为中国在AI领域的创新走在了世界前列。
此次XDF 2019除了安富利和Silexic两家钻石赞助商之外还邀请了很多国内的合作厂商前来参展,包括百度、阿里和国内最大的云服务器提供商浪潮。
浪潮集团高级副总裁彭震在今天的演讲中也表示:浪潮判断FPGA将会成为IT技术架构里面一个非常重要的不可缺少的重要的构成部分。
浪潮在大会的展厅上还展示了多款基于赛灵思芯片的FPGA解决方案与产品。其中,通用智慧金融加速平台提供证券、期货、银行等典型加速方案,可满足行情、交易和风控等多种金融业务场景的需求;而基于F37X的多通道、低延迟目标检测解决方案,支持1080P 原始视频流输入,在分布式FPGA技术平台上实现了8ms超低延迟,可满足短视频、智慧城市等多种智能视频场景需求。
此外,浪潮还展示多款创新的FPGA加速设备,如全球首款内嵌HBM2高带宽内部存储的FPGA加速卡F37X,面向视频监控领域的多通道视频AI加速卡F07V,集成RDMA的高性能网络、低延迟计算卸载的智能网卡N10X等等。
实习/全职编辑记者招聘ing
加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn