有关注云计算领域的朋友可能知道,在今年的11月底到12月初,亚马逊云科技按惯例召开了2022年度的re:Invent全球大会。在这场活动中,亚马逊云科技不仅再一次高调“秀”出了他们的年度业绩、行业地位,同时还发布了一大批全新的软硬件服务、最新的云计算技术,展示了云计算的前沿发展方向。
然而,re:Invent全球大会毕竟是一场持续数天、涵盖数百场分论坛的大型活动,所以想用一篇内容来总结它的内涵,几乎是不可能的事情。正因如此,我们三易生活选择了耐心等待,直到近日亚马逊云科技在国内专门针对2022 re:Invent全球大会的内容,进行了一次精练的、生动的宣讲,再结合我们此前已经获悉的相关信息,才有了今天这篇内容。
即便如此,我们也并未打算去讲那些太过深奥的内容。因为今天我们要关注的话题,其实是2022 re:Invent全球大会上最为耀眼的“硬货”,三款亚马逊云科技自主研发的全新云计算芯片。
Nitro V5、Graviton3E、Inferentia2 三箭齐发
首先,我们来看看这三款芯片的基础规格。
其中,Nitro V5是一颗同时肩负虚拟化、网络处理、以及存储管理功能的芯片。而作为亚马逊云科技早在2012年就已开始研发、资历最老的自有芯片产品之一,Nitro的每一代演进几乎都会带来翻倍级的规格提升。
例如,第一代Nitro的网络性能只能做到万兆级别(10Gbps),到了第四代就已经可以做到十万兆(100Gbps),性能提升了十倍。而在报文转换能力方面,第一代Nitro只能每秒钟转发约120万个报文,到第四代一秒钟的转发能力就已经达到了1500万个报文,上升幅度甚至超过了十倍。
同理,Nitro V5的晶体管数量是上一代的两倍,数据包转发能力提升了60%、延迟减少了30%,同时它还变得更省电了,其每瓦特的性能提升了40%之多。
其次,我们还迎来了Graviton3E,这也是亚马逊云科技自研高性能CPU家族的最新成员。根据官方公布的信息显示,它专门为浮点和向量指令运算进行了优化,在特定场景中能够带来35%的性能提升。
最后,针对机器学习推理场景,亚马逊云科技此次还发布了下代自研推理芯片Inferentia2,以及基于它的Amazon EC2 Inf2实例。与前代实例相比,新的实例吞吐量提升了4倍、延迟降低了90%,同时每瓦性能提高了45%。
自研芯片意味着什么?它能大幅强化竞争力
众所周知,对于大型服务器来说,“虚拟化”几乎是必须要有的一大技术特性。它不仅可以解决硬件架构之间的差异问题,也能大幅强化整套系统的安全性。
但是传统的虚拟化技术是依托CPU指令集实现,这就意味着一旦开启,就会额外消耗CPU算力、降低内存性能。而对于云计算体系来说,算力降低就意味着成本的上涨,无论是对于运营商还是客户来说,显然都会造成损害。
明白了这一点,我们再来看看亚马逊云科技此次推出的自研芯片组合。首先Nitro V5最大的特别之处,就在于它能够完全接管整套系统的虚拟化计算工作。也就是说,有它在,CPU本身便不再需要浪费算力在“虚拟化指令集”上,可将自身的性能100%用于工作负载、“解放生产力”。
其次,与传统的、服务器用的x86处理器相比,亚马逊云科技自研的Graviton3系列处理器一方面使用了时下最新的小芯片架构,来降低制造难度、提升成本优势。另一方面,它不带有SMT(也就是俗称的“超线程”)功能,所有的虚拟CPU都会按照1:1的比例分配给物理内核,这就使得它降低了指令预测过程中的性能消耗。
最终与使用x86架构的EC2实例相比,基于Graviton3处理器的EC2实例能效高出了60%,这就意味着在执行相同的计算量时,它的单价更低、可以直接为客户带来实惠,并为亚马逊云科技的业务带来显著的“性价比”优势。
最后,机器学习模型近年来发展的越来越快,如今一个大型模型可能会拥有十亿个变量,并且在一两年后,这个数字可能会发展到万亿个的级别。这也就意味着,传统的硬件处理架构根本不可能跟得上机器学习推理的性能需求。
而“天生”就专门针对分布式计算设计的亚马逊云科技Inferentia2推理芯片,却完全不存在这个问题,因为它可以轻易地扩展计算规模,很简单就能实现超过一万颗芯片的集群计算。因此基于这款芯片的Amazon EC2 Inf2实例,也就此成为了行业中目前唯一一个,为超大型模型推理做好准备的实例。
自研芯片不为炫技,亚马逊云科技很务实
特别、显著、唯一……是的,我们频繁使用了这些词语来形容亚马逊云科技的自研芯片家族,以及他们对于这家全球云计算领军厂商的重要意义。
但可能你没有想到的是,从某种程度上来说,亚马逊云科技的这些硬件创新并没有那么“高调”,甚至它们可能还显得非常“朴实无华”。
比如说,亚马逊云科技副总裁兼EC2杰出工程师Anthony Liguori此前在接受访谈时就曾披露,Graviton3E相比于先前发布的Graviton3,主要其实就是增强了FPU(浮点单元)与Neon引擎(类似x86处理器的SSE引擎)的供电设计,并提高了这两个单元的运行频率。换句话说,它有点像是一种官方“特挑小改+超频”版本,而不见得是重新设计了整个芯片。
但又不得不承认的是,这样的“小改动”在实际业务中带来了显著的提升。比如当用于分子运动分析时,新款处理器能将总体的用时缩短11%,如果是用于计算金融期权定价,那么Graviton3E甚至是足足快了30%。
这意味着什么?简单来说,它所反映出的事实是,当亚马逊云科技在设计和改进自研芯片时,他们首先考虑到的是实际业务需求,而不是为了部分参数上的“好看”。而亚马逊云科技这些完全出自实用考量的硬件设计,基础的思路又来自于他们常年市占率全球第一、并且受到无数用户青睐的云计算业务。
说得更直白点,当拳头游戏(Riot Games)在亚马逊云科技的服务器上每秒处理50万个游戏事件、当纳斯达克将他们的MRX期权核心交易系统搬迁到亚马逊云科技的云端运行,当西门子在亚马逊云科技的节点运行他们的工业云服务时……这些庞大数据背后的运营经验,实际上就进一步变为了亚马逊云科技远超竞争对手,去针对性构建自主云基础设施的“底气”所在。
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除