时至今日,生成式AI在创意输出(如写作、编程、设计)、功能增强(如写摘要、搜索)、交互式体验(Q&A、聊天)和决策支持(各类助理)这四个领域已展现出惊人潜力。
在亚马逊云科技2023中国峰会上,亚马逊云科技大中华区产品部总经理陈晓建也带来两类实际案例,向我们展示了它是如何帮助企业解决在如今的生成式AI大背景下进行创新时,遇到的算力资源和全球化问题。
由于生成式AI技术的爆发,行业整体算力需求井喷,并由此带来三大挑战:算力资源本身的紧缺、计算资源的弹性化供给困惑以及云上运维的门槛和复杂度还不够低。
首先,亚马逊云科技推出各类自研芯片,如可以帮CPU减负的云计算专用芯片Amazon Nitro、基于ARM架构的通用处理器芯片Amazon Graviton以及专为机器学习训练和推理开发的Amazon Inferentia和Amazon Traininum系列芯片,来帮助企业实现超高的算力性价比。
以F1赛车为例,主办方通过使用亚马逊云科技的Amazon Graviton 3E芯片进行空气动力学模拟,才得以用比以往快70%的速度来开发新一代赛车,并将赛车压力损失从50%降低到15%。这就意味着车主在驾驶时可以更容易地进行超车,给车迷带来更精彩的赛场缠斗。
其次,亚马逊云科技通过各种丰富的计算网络存储(可按需选择或者直接帮你智能分级)以及产品组合(超600种不同计算实例)来帮助用户应对突发的算力需求,实现高度弹性化的计算资源供给。
以维塔数码云上工作室为例,它曾获得6次奥斯卡最佳特效奖,作品包括《阿凡达》《指环王》《猩球崛起》等。由于亚马逊云科技提供的基础架构算力资源、云上制作堆栈和机器学习堆栈等一系列服务,该工作室只用了8个月就完成了高达33亿渲染线程小时的《阿凡达2》云上特效制作;反观《阿凡达1》,“当初用了整整14个月才看到了第一帧”。
最后,亚马逊云科技还通过Serverless技术来简化云上运维管理,帮助游戏公司朝夕光年专注于游戏《Marvel Snap》本身的开发,而不用担心访问量剧烈增加时的系统升级和扩容工作。陈晓建介绍,该游戏最终启动后没有发生一个后端错误事件,在游戏行业闻所未闻。
除了算力资源,许多企业在如今的全球化大趋势下也有三大诉求:所有业务实现云上统一管理并保证高可靠和低延迟、搭建组网的过程要既快速且高效、以及能否符合当地的法规要求,保障业务顺利出海。
以OPPO为例,他们的手机业务遍布全球,存在上百的云上VPC和本地资源需要连接,非常考验全球组网难度。而依托亚马逊云科技的Amazon Cloud WAN服务,只需分分钟便快速搭建好了一个全球网络,它既能保持OPPO的全球业务独立运作、区域合规自治,同时又能进行统一管理。
其次,对于网络可靠性、延迟性要求非常高的资本交易市场纳斯达克,亚马逊云科技则凭借Amazon Outposts服务帮它建成了资本市场行业有史以来的第一个私有本地区域,并实现超低延迟的边缘计算功能。
最后,全球电子支付终端供应商Pax,也依靠亚马逊云科技的Amazon CloudHSM、Amazon Security Hub等一系列服务,满足了多个供应商提供的安全服务标准,保障用户支付安全,并使交付周期缩短了40%,成本降低20%,实现国际业务顺利拓展。
以上这些成功的合作案例,都很好地说明了亚马逊云科技在帮助企业摆脱基础架构限制、专注于创新上的成效。
坚持“给底座造底座”
事实上,对于这波生成式AI浪潮,早在4月份,亚马逊云科技就向公众表明了自己的定位:人人都去卷大模型本身,我们要给底座造底座。
如今两位高管在亚马逊云科技中国峰会上的演讲,再一次释放了同样的信息:为大众开发生成式AI应用做基础支持、做底座支撑。
怎么理解“底座”这个概念?
可以快速获得世界最先进基础模型能力的全托管平台Amazon Bedrock,是底座;用于训练和运行自家模型的高性能基础设施,如Amazon Inferentia芯片支持的Amazon EC2 Inf1实例、Amazon Trainium支持的Amazon EC2 Trn1实例以及英伟达H100 Tensor Core GPU支持的Amazon EC2 P5实例,是底座;从头构建、训练和部署自己的模型的Amazon SageMaker,是底座;支持一键式部署和150多种流行开源模型微调的Amazon SageMaker Jumpstart,更是底座;它们都是服务于我们的大模型、服务于生成式AI应用开发的基础工具,作为底座,目的就是降低使用门槛,把大模型和生成式AI技术变成一种即取即用的资源,让更多企业、组织和个人触及。
亚马逊云科技拥有超过25年的AI经验,并有超过10万名客户使用亚马逊云科技的AI和机器学习服务助力自己的业务。
而在这场洪流之中,得益于亚马逊云科技这样的底座服务的存在,让每个企业、每个人都有机会去获得、利用和享受新技术带来的福利。没有人会在这场变革之中被主动落下,尚不均匀的分布终将得到改善、若隐若现的未来也会变得异常清晰。