一年一度的云计算春晚——亚马逊云科技re:Invent,近日盛大开幕。那么“云计算春晚”发布了什么AI产品?
首先来看Amazon SageMaker,今年是其发布的第五年,各行各业已有数百万个机器学习模型使用该服务管理,每月进行数千亿次的预测。
今年最重磅的新功能是机器学习治理工具Amazon SageMaker ML Governance,具体来说有3个新工具:
● Role Manager,可以在几分钟内为SageMaker用户定义自定义权限,区分算法工程师、运维工程师等不同角色。
● Model Cards,可以发现并自动填充诸如训练作业、训练数据集、模型构建和推理环境等细节,还可以记录模型的详细信息,例如模型的预期用途、风险评级和评估结果。
● Model Dashboard,更是可以通过统一的仪表板监控所有部署的模型。
在这些工具帮助下,可以简化访问控制,提高机器学习项目的透明度。
接下来是Amazon SageMaker Data Wrangler再次新增40多种新的数据源,可将汇总和准备机器学习(ML)数据所需的时间从数周缩短至几分钟。
还有一个有意思的更新,是增加对地理空间数据(Geospatialdata)的机器学习支持,如卫星、地图和位置数据。具体来说简化了利用地理空间数据创建、训练和模型部署的全过程,还可以在Amazon SageMaker的交互式地图上分析和探索、分享机器学习预测结果。交通、物流、零售,甚至自然灾害监测等行业都可从中受益。
看过机器学习平台,再来看算力方面,这次的更新重点是对大模型的支持。最新发布的Amazon EC2 Inf2,针对机器学习推理优化的虚拟机实例,与上一代Inf1相比有4倍吞吐量提升、延迟降低十分之一。
Inf1对当时常见的中小模型来说恰到好处,但随着大模型逐渐实用化,对更高规格推理实例的需求也在增长。Inf2专为部署当今最严苛的深度学习模型而设计,是第一个支持分布式推理的Amazon EC2实例,在自研Inferentia2推理芯片支持下可以运行高达1,750亿参数的大模型。也就是跑个GPT-3级别的大语言模型或者Stable Diffusion这样的图像生成模型等都不在话下。
早些时候,亚马逊云科技还发布了Amazon EC2 Trn1,为机器学习训练打造,与基于GPU的同类产品相比,可节省高达50%的训练成本。