目前,云计算已深入到整个云基础设施,进入硬件协同创新的“深水区”,芯片创新之路是最底层的创新,是最具颠覆性的,也是改变云计算游戏规则的能力。 而亚马逊云科技硬件创新背后的初衷:为云而生的硬件设计,满足用户所有负载的需求。为云而生的硬件设计,满足用户所有负载的需求。让我们回顾下亚马逊云科技在芯片领域的创新发展史:
2013年,亚马逊云科技推出首颗 Nitro芯片;
2015年,以3.5亿美元收购芯片制造商Annapurna Labs;
2018年,发布第一代服务器芯片 Graviton;
2020年,推出第一代自研机器学习推理芯片 Inferentia 和训练芯片Trainium。
到现在,亚马逊云科技已拥有虚拟化芯片Nitro、服务器芯片Graviton、AI/ML芯片三条产品线,这条自研芯片之路也一直在开业界先河,引业界潮流,走得非常坚定。
一、走上自研芯片之路,亚马逊云科技勇往直前
正如亚马逊云科技首席执行官 Adam Selipsky 在今年 re:lnvent 2022大会中谈到的:当亚马逊云科技在不同的领域进行探索时,客户告诉我们如何对待从来没有进入过的领域,我们帮助客户获得大量数据进行更好的洞察,在非常极端的情况下挑战极限、探索无限可能。我们共同持续探索,在不同环境中取得更好的成绩,在探索中改变改变行业,甚至未来。
Adam Selipsky提到:“16 年来,亚马逊云科技一直在优化和创新计算、存储和网络基础设施服务,以支持您的所有工作负载。目前亚马逊云科技已有 600 多种不同的计算实例类型,因此您可以找到适合您的所有应用需求的正确资源组合。”
这也是亚马逊云科技要做自研芯片的初衷,而走上自研芯片之路,也为行业和客户带来更多的改变:首先是“量体裁衣”,在芯片市场、CPU市场里取得大的市场份额,不是亚马逊云科技的目标,而是把更丰富的产品的选择权交给客户,为客户不断变化的工作负载提供更好的云服务;其次,自研芯片是一种很好的提高性价比的解决方案,能为客户不断优化云服务的性价比,让计算真正的满足用户所有负载的需求。
二、自研芯片再升级,重构云上算力
在 2018年的 re:Invent 大会上,亚马逊云科技发布了自研的 Amazon Graviton 第一代处理器。这是亚马逊云科技为云设计开发的芯片,之后2020 年、2021 年陆续推出了第二代、第三代。与第一代 Graviton 处理器相比,Amazon Graviton2处理器在性能和功能方面实现了重大飞跃,性能是前者的7倍、计算核心数量达到 4倍、缓存达到 2 倍、内存速度达到 5 倍。
Amazon Graviton 2 每个核心的加密性能速度比第一代 Amazon Graviton 处理器提高 50%。一年后发布的 Amazon Graviton3 处理器进一步将计算性能提高 25%,浮点性能提高 2 倍,加密工作负载性能最多加快 2 倍,基于前沿 DDR5内存技术的内存访问速度提高了50%,在同样的性能上可以节省60%的能耗。
在2021年re:Invent大会上同时发布了基于Amazon Graviton3处理器的 Amazon EC2 C7g 实例,支持高达128GiB 的内存配置、30Gbps 的网络性能和20Gbps 的 Amazon Elastic Block Store 性能。创新的速度达到新高。而且,Graviton3还将是第一个支持原生BFloat16的云处理器。BFloat16是当今最流行的数据格式之一,对于许多机器学习工作负载来说,可以产生与更高精度的32位数字一样的结果,从而能得到更好的性能。
北京时间11月29日上午11:30,亚马逊云科技高级副总裁 Peter DeSantis 的精彩演讲,正式开启了2022亚马逊云科技 re:lnvent 全球大会的帷幕。亚马逊云科技重磅发布了新版本基于 Arm 定制的 Graviton3E系列芯片,专为支持高性能计算工作负载而设计。新的Graviton3E 芯片,相比现有 Graviton 系列,有着更高的性能提升,针对机器学习中的浮点和矢量数学计算进行优化,在HPL基线测试中,工作负载的性能提高35%。
基于 Graviton3E 芯片,亚马逊云科技推出了面向高性能计算的 HPC7g ,最多具有64个 vCPU 和 128GiB 内存,适用于天气预报、生命科学、工程计算等高性能计算场景。
以及支持高达 200Gbps 的网络带宽,可以提高50%的数据包处理性能的C7gn ,为要求更为严苛的网络虚拟设备、数据分析和紧密耦合的集群计算等,网络密集型作业场景而设计。
亚马逊云科技效用计算高级副总裁 Peter DeSantis 表示:“我们一直在创新,在不需要牺牲安全的情况下,减少我们的成本,同时提高我们的性能,让客户及应用获得更好的体验。”
亚马逊云科技自研芯片组成的芯片家族,也正在以强大的技术创新能力,为客户提供“量体裁衣”,同时也不断优化云服务的性价比。