日前,(爱思唯尔)云论坛暨第九届IRI在线学术会议成功举行。我们一起展示了信息技术芯片的发展和创新。
论坛由上海交通大学集成量子信息技术研究中心主任金贤民教授主办,邀请了上海交通大学人工智能研究所首席科学家教授、浙江大学光电科学与工程学院副院长戴道锌教授、北京大学类脑智能芯片研究中心主任杨教授、上海交通大学物理与天文学院副研究员唐浩等参加。 和爱思唯尔核心内容的客户顾问许婧博士,围绕信息技术芯片的基本技术原理、产品应用和未来发展分享主题。
本文将结合论坛的主要内容和信息处理芯片的现状,对未来备受关注的三种信息技术芯片进行概念解读和行业分析。
信息技术芯片的演变反映了计算能力的螺旋上升
在计算能力需求大幅增加的背景下,信息技术芯片承载的计算处理能力不足,这来自于架构方面、智能水平、功耗、软件能力等诸多挑战。
以CPU为代表的最早的计算芯片仍然采用传统的冯诺依曼架构,最大的特点是存储与计算分离,这也是冯诺依曼架构的瓶颈。计算前需要从内存中读取数据,然后执行计算。在这个过程中,功耗和延迟都花在了数据处理上。单次操作而言,大多数情况下,处理数据所需的功耗约占总功耗的70%。解决这个问题最直接的方法就是实现存储和计算的一体化。
同时,内存性能的提高远远落后于计算器性能的提高。由于冯诺依曼瓶颈和存储墙的存在,计算能力的提升在存储-计算分离架构下面临天花板。为了解决这一困境,出现了更多类型的非冯诺依曼架构芯片,如类脑芯片、光子芯片等。
除了架构的限制,智能水平的提升也在向计算芯片更智能化的阶段迈进。2011年,风险投资公司的总合伙人在《华尔街日报》上发表了一篇很有影响力的文章,题为——《软件为什么在吞噬世界》。十年后,我们正站在“深度学习正在吞噬整个世界”的节点上。
基于人工智能的自然语言处理、图像识别和自动驾驶等技术进步是以消耗计算资源和能量为代价的。工程师和计算机科学家正在努力寻找一种更有效的方法来训练和运行深层神经网络。这也是未来升级进化计算芯片的主要目的,为了让它们更好的执行AI计算。
第三代神经网络技术有望向类脑脉冲神经网络技术演进,对更高智能水平的人工智能技术的需求也带动了计算平台的架构升级和智能升级。
不难发现,人脑本质上是一个典型的高智能、低功耗的单一计算平台。类脑芯片是一种典型的存储计算一体化、高智能的计算架构。对类脑智能和类脑芯片的研究已经成为世界上一个非常重要的前沿课题。
图1显示了本文关注的三种信息技术芯片
面对计算能力需求的提高和人工智能水平的发展,对于信息技术芯片的代际进化,数字神经网络加速器(芯片)是近期的主流解决方案;中长期来看,类脑芯片是解决方案之一。除了集成电路芯片在算法、器件和工艺上的突破,集成光子芯片的研发也是解决计算能力瓶颈的有效途径。
未来计算芯片的三个方向是更好的执行AI计算
方向1:
CPUGPU
整个全球CPU市场都被Intel和AMD占领了。英特尔在台式机、笔记本和服务器细分市场的收入规模和市场份额方面远远领先于AMD(如图2所示)。
经过几十年的探索,国内CPU行业已经初具规模。国内6家CPU芯片厂商基于86架构的复杂指令集(CISC)有——个,包括广海(86)和上海赵信(86);RISC下涉及ARM架构、MIPS架构、Alpha架构,有华为鲲鹏(ARM)、天津腾飞(ARM)、龙芯(MIPS)、神威(Alpha)。
图2显示了英特尔、英伟达和AMD的一些财务数据
目前最常见的适合神经网络计算的加速器解决方案是GPU,本质上还是一种高级的冯诺依曼架构。
和CPU一样,全球GPU市场高度集中,英特尔、英伟达、AMD争霸。
据JonPeddieResearch数据,在集成GPU领域,截至2019年第四季度,英特尔以63%的市场份额排名第一,AMD和NVIDIA分别以19%和18%的市场份额排名第二和第三;在独立GPU领域,英伟达占有绝对优势,市场份额为68.92%,AMD位居第二,市场份额为31.08%。
三驾马车奠定了英伟达在GPU市场的主导地位。长期以来,游戏显卡业务贡献很大,游戏部为其创造了一定的业绩增长和健康的现金流。2015年,英伟达的营收首次超过AMD。之后,NVIDIAGPU在数据中心业务上又获得了一轮爆发式增长。
此外,在阿里巴巴云、AWS、MicrosoftAzure和GoogleCloud厂商中,NVIDIA的市场份额明显领先于AMD等厂商,NVIDIA在全球各大云厂商中占据绝对领先地位。像亚马逊和微软
oft这样的大型云厂商,在计算芯片上投入了大量资金来支持机器学习算法,Google也在研发自己的专用机器学习芯片。图3丨NVIDIA及AMD的部分财务数据
除此之外,NVIDIA市值和业务最有想象空间的还是自动驾驶计算平台(汽车中控计算芯片)。同时整个计算芯片市场的主要增长动力预计也将从数据中心,转移到自动驾驶汽车。
CPU/GPU计算芯片的代表公司(仅为部分,并未穷尽)
Intel(英特尔):成立于1968年的英特尔,崛起于PC时代,创办人之一的GordonMoore提出了半导体产业经典的摩尔定律。面对异构计算架构时代,英特尔以“SVMS架构”应对,发布多款FPGA产品。今年3月,英特尔宣布重启晶圆代工服务,重回7nm晶圆制程技术战场。
NVIDIA(英伟达):NVIDIA正在加速从芯片到CPU和GPU的连接方式,再到整个软件堆栈,以及最终跨整个数据中心的性能提升。2020年发布了首款安培架构GPU——NVIDIAA100,单片A100包含超过540亿个晶体管,使其成为世界上最大的7nm处理器。同时发布NVIDIADGXA100系统,单节点AI算力达到创纪录的5PFLOPS,5个DGXA100系统组成的一个机架,算力可媲美一个AI数据中心。
AMD:AMD于2020年正式推出锐龙5000系列台式机处理器,采用全新“Zen3”核心架构,这是自AMD2017年推出“Zen”处理器以来提升最大的一次。得益于IPC和频率的双重提升,AMD锐龙95900X也是首款默认设置下CineBenchR20单核心分数超过600的台式机处理器。
中科曙光(Sugon):中国中科曙光依托中科院科研实力与产业资源,掌握大量高端计算机、存储和云计算等领域核心技术,九次摘得中国超算Top100份额第一,在2019年第54届全球超算Top500中以71套系统并列第二名,在国内高性能计算市场绝对领先份额。
兆芯(Zhaoxin):中国上海兆芯同时拥有CPU、GPU、芯片组三种IP及芯片自主研发能力,开先KX-6000和开胜KH-30000系列处理器基于16nm工艺,是国内首款主频达到3.0GHz的国产通用处理器。
景嘉微(JINGJIAMICRO):中国长沙景嘉微是国产GPU代表力量,2020年预计实现营业总收入6.54亿元。在图形显控领域,以JM5400研发成功为起点,研发国产高性能低功耗图形处理芯片。第二代GPU芯片JM7200流片成功,采用28nm工艺,已完成与龙芯、飞腾、麒麟软件、国心泰山、道、天脉等国内主要的CPU和操作系统厂商的适配工作。
FPGA/ASIC
回顾2020年并购交易额超过10亿美元的19笔交易,大多数并购活动集中在半导体领域。Salesforce和NVIDIA是唯一进行多次重大收购的公司(如图4所示)。
第二大并购事件则是AMD——Intel在CPU领域的最大对手、NVIDIA在GPU领域的竞争者——以350亿美元收购Xilinx(赛灵思)。这不禁让人想起2015年英特尔以167亿美元收购Altera一案。Altera和Xilinx曾是FPGA双雄,而现在FPGA独霸之主Xilinx也要被AMD收购。
图4丨2020年最大的科技并购事件
除了CPU之外,GPU、APU、TPU、FPGA(现场可编程门阵列)、ASIC(专用集成电路)等多种类型的加速器芯片正扮演着愈加重要的角色。在许多情况下,这些加速器与CPU等芯片一起工作,用于加速某些对应用至关重要的任务,例如计算机视觉应用中的图像识别。多种芯片协同工作的架构通常称为异构计算。
FPGA(现场可编程门阵列)是一种灵活的半导体芯片架构,能够在产品设计完成,甚至在投入现场使用之后进行更改或更新(由此得名)。FPGA的设计初衷是成为ASIC(专用集成电路)更灵活的替代品。
有些FPGA专门用于高性能、数据密集的工作场景,如云端数据中心,这时它们需要的运行功率高达几百瓦;有些则用于小型、低功耗的设计,其功耗可能低至1毫瓦(千分之一瓦);还有些介于两者之间。由于它们本身非常灵活,可应用于各类广泛的环境。
以云端数据中心为例,微软一直都在使用高功耗的FPGA来加速Bing搜索引擎的速度。在此应用中,FPGA与CPU协同工作来加速微软针对必应开发的特定搜索算法。这类高功耗的FPGA多由Xilinx和Intel提供。
而在一些无人机、安防摄像头和可穿戴产品等消费电子应用中,以及预测性维护、马达控制和机器视觉等工业应用中,小尺寸、功耗更低的FPGA正适配于网络边缘计算设备上去运行基于人工智能的软件算法。
在未来十年内,汽车自动驾驶是FPGA最重要的一个探索和应用场景。不仅因为FPGA灵活的内部架构,它还能很好地适用于特定的连接功能,尤其是连接各类不同的信号输入。除了在车载信息娱乐系统中显身手外,FPGA开始扮演一些新角色,作为多路数据的聚合器。
但由于ASIC一旦设计并生产出来,它的功能基本不能修改,除非重新设计和构建全新的芯片。且ASIC设计起来比较困难、价格高昂,在实际通用场景下比较少见。随着时间推移和场景侧的落地,未来专用于自动驾驶侧的ASIC芯片有可能成为主流方向。
图5丨Intel在汽车自动驾驶场景用FPGA市场占主流位置
全球主攻FPGA市场的企业中,除了有Xilinx和Altera双雄之外,Lattice也是专做FPGA的上市公司。中国主攻FPGA的创业公司有安路科技和高云半导体。
巨头Intel也是FPGA的强有力竞争者,英特尔不仅是CPU王者,又收购了Altera,在FPGA领域布下一子。综合来说,Intel的计算芯片在汽车自动驾驶市场中的采用率,处于主流位置。不仅自动驾驶FPGA芯片已经量产,还收购Mobileye这家全球领先的视觉ADAS厂商,仅有自主的专有软件算法,以及EyeQ芯片。
图6丨全球CPU及神经网络加速器头部公司财务表现
全球FPGA/ASIC代表公司
Lattice:低功耗FPPA市场的有力竞争者。长期盘踞消费电子市场的Lattice逐渐将触手伸入工业和汽车领域,更加侧重于边缘端、嵌入式、低功耗、小尺寸的产品设计开发上。
安路科技(ANLOGIC):成立于2011年,大基金、华大半导体加持的FPGA创业公司,侧重工业市场。于2015年推出其第一代FPGAAL3-10,当前已经形成了从几百个逻辑单元CPLD到400K逻辑单元FPGA全系列布局。
高云半导体(GOWINSemiconductor):2015年一季度量产出国内第一块产业化的55nm工艺400万门的中密度FPGA芯片,并开放开发软件下载。至今五年时间陆续推出两大家族,100多种封装的FPGA芯片,例如集成PSRAM的FPGA,蓝牙FPGA、GOAI等创新尝试。
方向二:类脑芯片
人工智能中神经网络模型的一个重要特点就是计算量大,而且计算过程中涉及到的数据量也很大,因此对高算力和低能耗的要求极高。目前采用冯·诺伊曼架构的主流处理器系统能耗过高、认知任务处理能力不足,无法完全满足这种要求。在这样的时代背景下,打破冯·诺伊曼架构的束缚就成为了必然的趋势。
人脑是非常理想的计算架构参考对象。人脑约有1000亿个神经元和100万亿个突触,能够在极低的能耗下,完成复杂的关联记忆、自主识别、自主学习等认知处理。这是基于脑神经网络的多层次复杂空间结构和脑神经的高度可塑性。
类脑芯片则是典型的非冯·诺伊曼架构。类脑计算架构的核心正是借鉴人脑信息处理方式,将存储和计算一体化,能够实时处理非结构化信息,具备自主学习能力,同时满足超低功耗的需求。
目前市场上尚未出现量产的可商用的类脑芯片,但已有很多国家和机构在类脑计算研究和产业化领域探索了多年。海外类脑计算芯片产业化道路走在最前面的代表有两家公司:IBM和Intel,他们发布了两款全数字类脑计算芯片。
IBMTrueNorth
2014年,IBM推出了神经网络推断芯片TrueNorth,它借鉴神经元工作原理及其信息传递机制,实现了存储与计算的融合。该芯片包含4096个神经突触核心,每个核心包含了256个神经元和6.4万个突触,合计约100万个神经元和2.56亿个突触。
TrueNorth芯片的功耗低至仅70毫瓦,比传统处理器低了4个数量级。更形象的来说,这相当于一款邮票大小的神经突触原理超级计算机,并且仅用一块智能手机的电池就可以维持工作近一周时间。TrueNorth芯片的功率密度也做到了20毫瓦/平方厘米,接近脑皮层的水平,同样相比于CPU低了3-4个数量级。
TrueNorth芯片同时具有很好的扩展性,能通过外部连接组成更加复杂的硅基神经网络系统。2018年,NS16e-4系统问世,它集成了64个TrueNorth芯片,神经元数量达到了6400万个。根据IBM官网介绍,依托TrueNorth可以扩展出拥有10亿神经元、2560亿神经突触的超级计算系统,然而功耗仅相当于一台桌面计算机。
图7|基于64个TrueNorth芯片的NS16e-4系统,集成了6400万个神经元(来源:https://modha.org)
IBM也正在探索TrueNorth芯片在多个领域的应用潜力,包括:运动归类、音频处理、立体视觉、强化学习、机器人、分类等。
图8|TrueNorth芯片应用探索
IntelLoihi
2017年,Intel推出了支持片上学习的Loihi脉冲神经网络芯片,每个芯片包含128个神经形态核心和3个×86处理器核心,总计13.1万个神经元。与TrueNorth芯片类似的是,Loihi芯片同样表现出了非常好的可扩展性。
2019年,Intel推出了64颗Loihi芯片集成的PohoikiBeach系统。2020年,Intel又推出了PohoikiSprings系统,包含了768颗Loihi芯片,共拥有1亿个神经元,已经相当于一个小型哺乳动物的大脑容量。
根据Intel官方披露,英特尔的PohoikiSprings等神经拟态系统仍处于研究阶段,其设计目的并非取代传统的计算系统,而是为研究人员提供一个工具来开发和表征新的神经启发算法,用于实时处理、问题解决、适应和学习。
目前,Loihi芯片的应用在以下几个领域表现出了更快的运算速度和更低的能耗:语音命令识别、手势识别、图像检索、优化和检索、机器人。
中国的类脑计算研发也产生了显著的成果,这其中包括清华大学的“天机芯”、浙江大学的“达尔文芯片”以及创业公司SynSense时识
相关阅读
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除
标签: #信息技术最新动态