AIGC独角兽官宣联手,支持千亿大模型的云实例发布,“云计算春晚”比世界杯还热闹...

news2024/11/15 21:32:08
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

现在AI最火的方向是什么?那必须是AIGC(AI Generated Content,利用人工智能技术来生成内容)。

AIGC最火的公司是谁?莫过于开源AI作画模型Stable Diffusion背后的StabilityAI

对于这家新晋独角兽,最近两条动向值得关注:

  • 产品上,Stable Diffusion 2.0正式发布,生成图像质量大幅提升,分辨率也支持到2048x2048甚至更高。

  • 战略上,与亚马逊云科技达成合作,继续构建图像,语言,音频,视频和3D 内容生成模型。

8cf5fb9f0977964a7abc07a380d08d0c.png

StableDiffusion其实由三部分组成,语言编码器、生成图像信息的扩散模型、以及图像解码器,1.0版本训练阶段足足用了256块英伟达A100,跑了15万个GPU时。

开发像这样的大模型,对于创业公司来说其实困难重重:

  • 数据准备、模型开发、训练调优到部署等,每一个环节都不简单。

  • 训练和推理阶段要兼容不同芯片,还要考虑到与各式各样业务的整合交付。

总之在算法以外还有很多让人头痛的地方,这也就是他们选择与亚马逊云科技合作背后的几点考虑了。

首先是看中Amazon SageMaker,亚马逊云科技的旗舰级托管式机器学习服务,可以帮助开发者轻松快速地准备数据,并大规模地构建、训练、部署高质量机器学习模型。

第二是在亚马逊云科技自研的Trainium训练芯片支持下,训练时间和成本可以减少58%

最后是在亚马逊云科技帮助下可以把模型开放给更多学生、研究人员、创业公司和企业。

现在Stable Diffusion 2.0还与Amazon SageMaker完成集成,通过其JumpStart服务,用户只需点击下鼠标就可轻松部署预先训练好的模型。

毕竟他们的口号是“要让全球10亿人用上开源模型”

4d8cb95b654753a7358fa21d5d89cb46.png

StabilityAI与亚马逊云科技合作,是在刚刚举办的亚马逊云科技re:Invent大会上宣布,也就是业内常说的“云计算春晚”

今年大会上也发布了多项内容,从不同方面改进AI开发者的体验。

“云计算春晚”发布了什么AI产品?

首先来看Amazon SageMaker,今年是其发布的第五年,各行各业已有数百万个机器学习模型使用该服务管理,每月进行数千亿次的预测。

今年最重磅的新功能是机器学习治理工具Amazon SageMaker ML Governance,具体来说有3个新工具:

  • Role Manager,可以在几分钟内为SageMaker 用户定义自定义权限,区分算法工程师、运维工程师等不同角色。

  • Model Cards,可以发现并自动填充诸如训练作业、训练数据集、模型构件和推理环境等细节,还可以记录模型的详细信息,例如模型的预期用途、风险评级和评估结果。

  • Model Dashboard,更是可以通过统一的仪表板监控所有部署的模型。

在这些工具帮助下,可以简化访问控制,提高机器学习项目的透明度。

daab0cfd8a59c719213955fdd0155782.png

接下来是Amazon SageMaker Data Wrangler再次新增40多种新的数据源,可将汇总和准备机器学习 (ML) 数据所需的时间从数周缩短至几分钟。

f1f15d5252247939a8bc7c40326b9b2c.png

还有一个有意思的更新,是增加对地理空间数据(Geospatialdata)的机器学习支持,如卫星、地图和位置数据。

161b18a2358875225d14f934b3aaf214.png

具体来说简化了利用地理空间数据创建、训练和模型部署的全过程,还可以在Amazon SageMaker的交互式地图上分析和探索、分享机器学习预测结果。

交通、物流、零售,甚至自然灾害监测等行业都可从中受益。

da8d80d1d6f22b1bc59058d7d98cdad4.png

看过机器学习平台,再来看算力方面,这次的更新重点是对大模型的支持

最新发布的Amazon EC2 Inf2,针对机器学习推理优化的虚拟机实例,与上一代Inf1相比有4倍吞吐量提升、延迟降低到十分之一。

4e376e3f1395045c5a83aba225663dd8.png

Inf1对当时常见的中小模型来说恰到好处,但随着大模型逐渐实用化,对更高规格推理实例的需求也在增长。

Inf2专为部署当今最严苛的深度学习模型而设计,是第一个支持分布式推理的Amazon EC2 实例,在自研Inferentia2推理芯片支持下可以运行高达 1,750 亿参数的大模型。

也就是跑个GPT-3级别的大语言模型或者Stable Diffusion这样的图像生成模型等都不在话下。

早些时候,亚马逊云科技还发布了Amazon EC2 Trn1,为机器学习训练打造,与基于GPU的同类产品相比,可节省高达50%的训练成本。

AI开发如何走向规模化?

事实上,亚马逊云科技已建成一套最完整的机器学习和AI服务。

最底层是对CPU、GPU、自研AI加速芯片等不同算力的兼容,以及对各主流深度学习框架的原生支持。

中间Amazon SageMaker,包括机器学习集成开发环境(IDE)、模型调试器、模型监视器、模型分析器(Profiler)、AutoML、特征存储、无代码开发能力以及首个专用的持续集成和持续交付(CI/CD)工具等全面机器学习能力。

最上层还有一系列开箱即用的AI服务,NLP、视觉、语音核心能力,以及面向不同应用场景和行业的专业服务,如自动将语音转换为文本的Amazon Transcribe,以及辅助代码开发的Amazon CodeWhisperer。

3459021ed52c992ecaf47021cf1e3d92.png

靠着这一套完整的AI服务,即使是像Stability AI这样员工仅有100人出头的创业公司,也能做到机器学习开发的规模化、工程化。

实现途径之一是面向云原生开发。

云原生,标准定义是云计算时代一种构建和运行应用程序的方式,充分利用和发挥云计算平台的弹性和自动化优势,结合容器、微服务、无服务器 (Serverless) 等技术来构建现代化应用。

如果还不好理解,不妨“以史为鉴”一下。

传统的软件、APP开发如今已相对成熟,这是因为操作系统承担了很多工作。

包括向下与硬件的沟通工作、向上为上层应用制定好了很多标准和规范,软件开发只需面向特定的操作系统,就可以专注于功能实现。

到了AI时代,AI产品更多以服务的形式跑在云上,云计算平台就要承担起这个承上启下的角色,实现AI开发的标准化。

云原生给AI开发带来的好处,可以总结为几点:

敏捷,靠无服务器 (Serverless) 技术可以将管理基础设施的工作全部交给云服务商,开发者专注于实现业务逻辑。

全面,亚马逊云科技为汽车、金融、制造等多个行业提供解决方案,同时有无代码开发平台Amazon SageMaker Canvas等满足不同水平开发者需求。

高性价比,这方面有专为机器学习训练打造的训练芯片Trainium、推理芯片Inferentia提高性能,配合弹性可扩展的按需云计算资源分配机制。

在此基础上,就可摆脱“小作坊”进一步实现AI的工程化,或者叫MLOps,包括:

  • 建立可重复的训练工作流程以加速模型开发

  • 集中编目机器学习构件,用于模型可再现性和治理

  • 将机器学习工作流程与 CI/CD 管道集成,以加速投入生产

  • 持续监控生产中的数据和模型,以保持质量

Gartner咨询公司将AI工程化列为2022年十二大战略性技术趋势,IDC则预测到2024年60%的企业将MLOps用于机器学习工作流。

除了已有的产品和服务之外,云计算未来的发展更是值得关注。

操作系统为什么倍受重视?因为在那个位置上,每一点微小改进都能带来很大的收益。

云原生AI格局下,云计算基础架构也是如此,每一点创新都能对AI开发效率带来很大的提升

像这的产品和服务创新,每年底的亚马逊云科技re:Invent大会上都会带来数十款。

亚马逊云科技也连续12年蝉联Gartner云基础设施和平台服务魔力象限领导者,成为这一魔力象限的最长领跑者。

看到这里,对AI开发从工具到基础设施,从验证开发到大规模部署全方位加速创新的时代,你期待吗?

最后,如果你对以上内容想了解更多,可以观看大会精彩回放:

https://www.awsevents.cn/reInvent2022/?s=7982&smid=14975

(复制以上链接或点击阅读原文均可)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/57205.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数学】焦点弦定理(?)

因为和焦点弦相关的定理太多,我不会把哪一个公式叫成这样的名字,但百度搜出来就是这个名字 如图,椭圆中焦点弦 AB,∣FB∣k∣FA∣(k>0)AB, |FB|k|FA|(k>0)AB,∣FB∣k∣FA∣(k>0) ,求 ABABAB 倾斜角的余弦值 cos⁡θ\cos\t…

Anntec ZKUXFT XT2 FGPA卡DPDK使用方法

1. 建议环境 CPU Architecture x86_64、aarch64 CPU MHz: 2000以上 Memory 每个node空闲内存超过2G 硬盘 剩余空间大于100M OS Ubuntu,centos,银河麒麟,UOS等Linux …

亚马逊 CTO Werner Vogels:2023 年及未来五大技术趋势预测

近年来,几次全球性危机占据了我们的日常生活,因此看看我们是否可以利用技术来解决这些棘手的人类问题。如今,我们可以从很多互联设备获取数据,例如:可穿戴设备、医疗设备、环境传感器、视频捕捉设备等,数据…

DiffKit -- 世上最牛且开源的表数据对比工具

DiffKit -- 世上最牛且开源的表数据对比工具1. DiffKit Introduction1.1 Introduction1.2 Compatibility1.3 Download2. Quick Start3. User Guide4. Code5. Waken1. DiffKit Introduction 1.1 Introduction DiffKit Website: http://www.diffkit.org/index.html. 1.2 Compati…

excel数据分析

目录1. 对比分析2. 结构分析3. 分布分析3.1 VLooKup模糊匹配功能进行分组3.2 数据透视表进行数值型数据分组1. 对比分析 2. 结构分析 3. 分布分析 定义:根据分析目的,将数值型数据进行等距或不等距的分组 消费分布分析收入分布分析年龄分布分析 定量…

[附源码]Python计算机毕业设计Django交通事故档案管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

思派健康通过上市聆讯:半年亏损约35亿元,马旭广为董事长

12月2日,思派健康科技有限公司(下称“思派健康”)在港交所递交了聆讯后资料集。这代表着,思派健康已经通过港交所上市聆讯,将很快发行并在港交所IPO。 招股书显示,思派健康目前经营三条业务线,…

[附源码]JAVA毕业设计家庭理财管理系统(系统+LW)

[附源码]JAVA毕业设计家庭理财管理系统(系统LW) 目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术…

RTK-RTD-SBAS-WAAS-PPP-PPK-WADGPS

1. RTD:英文全称Real Time Differential,中文意思是实时动态码相位差分技术。工作方法是基准站将伪距(或者坐标)修正值(差分值)发给用户接收机,用户接收机根据差分值与本身的观测值算出精确位置…

事业编招聘:共青团市委所属事业单位2022年公开招聘公告

杭州青少年活动中心为共青团杭州市委所属财政适当补助事业单位,因工作需要,公开招聘事业编制工作人员3名。根据《关于贯彻落实国家人事部〈事业单位公开招聘人员暂行规定〉的实施办法》(杭人政〔2006〕5号)和《杭州市事业单位公开…

计网个人作业03

R14. True or false? a a. Suppose Host A is sending a large file to Host B over a TCP connection. If the sequence number for a segment of this connection is m, then the sequence number for the subsequent segment will necessarily be m 1. 假设主机A通过一…

厉害了!阿里内部都用的Spring+MyBatis源码手册,实战理论两不误

目前大部分的 Java 互联网项目,都是用 Spring MVC Spring MyBatis 搭建平台的。 使用 Spring IoC 可以有效的管理各类的 Java 资源,达到即插即拔的功能;通过 Spring AOP 框架,数据库事务可以委托给 Spring 管理,消除…

slam学习 - 基本VO代码学习

本打算学习 orb -slam3 源码,但还是先把《slam 14》上的代码看完再说,至少把整个流程走一遍。 相关参考 https://blog.csdn.net/weixin_44684139/article/details/105305564 https://blog.csdn.net/qq_35590091/article/details/97111744 代码需求分析…

蚁群算法(ant system,AS)

蚁群算法蚂蚁系统(ant system,AS)由Dorigo于1996年发表,文章题目为[《The Ant System : optimization by a colony of cooperating agents》](https://www.docin.com/p-1565494487.html)。在耳熟能详的TSP旅行商问题上AS算法有着不错的效果,这也是被大多…

Dynamsoft Barcode Reader C, C++, .NET, Java SDK

Dynamsoft Barcode Reader 9.6.0 支持 win/mac/linux,没有Python版本提供 Adds support for handling barcode image orientation. November 30, 2022 - 16:06 New Version Features C, C, .NET, Java and Python SDK Added support for handling image orientation. With …

为什么数据库不应该使用外键

当我们想要持久化地存储数据时,使用关系型数据库往往都是最稳妥的选择,这不仅因为今天的关系型数据库种类非常丰富并且稳定,还因为不同社区对关系型数据库的支持都非常完备。我们在前面的文章中曾经分析过 为什么 MySQL 的自增主键不单调也不…

利用Python处理excel表格,pandas分割表格、拆分表格

前言 记录一下,在使用pandas处理excel表格表格时候,关于分割(切分)表格这一块儿的操作。 这个系列会有三篇左右文章,这是第一篇,excel表格切割 我们常说的 excel文件, 在广义上,是指以 xls 或 xlsx 为后缀…

Compose 动画艺术探索之灵动岛

本文为稀土掘金技术社区首发签约文章,14天内禁止转载,14天后未获授权禁止转载,侵权必究! 本篇文章是此专栏的第五篇文章,本篇文章应该是此专栏中最后一篇直接关于动画的文章了,之后文章中可能会提到&#…

SpringBoot @InitBinder注解实现Bean国际化校验

参考资料 参考: 妥当性チェックのエラーメッセージ出力方法 (需翻墙)springMVC之InitBinder的用法1springMVC之InitBinder的用法2springMVC之InitBinder 和 ValidatorSpring MVCにおけるフォームバリデーションの適用事例【後編】 目录一. 前期准备1.1 自定义校验注…

【spark】第一章——Spark简介及环境配置

文章目录1. Spark 概述1.1 Spark 是什么1.2 Spark and Hadoop1.3 Spark or Hadoop1.4 Spark 核心模块2. Spark 快速上手2.1 创建 Maven 项目2.1.1 增加 Scala 插件2.1.2 增加依赖关系2.1.3 WordCount2.1.4 异常处理3. Spark 运行环境3.1 Local 模式3.1.1 解压缩文件3.1.2 启动 …