不止大模型,亚马逊云科技布局AIGC底座能力

news2024/12/28 18:06:54

 

“大模型只是客户需求的其中一个部分,但远远不是所有,客户还需要更广泛的基础能力。亚马逊云科技推出自研芯片、生成式AI服务Bedrock以及大模型Titan,都在致力于推动AIGC技术的普惠化,够降AIGC的技术门槛和资金门槛,让更多的人更容易的、更具性价比地去使用AIGC。”

近日,亚马逊云科技大中华区产品部总经理陈晓建在一次媒体沟通会上这样表示。

4月13日,亚马逊云科技正式入局AIGC,推出AIGC服务Bedrock和自有基础模型Titan,以及AI编程助手Amazon CodeWhisperer,并宣布基于自研训练和推理AI芯片的最新实例正式可用。

在AIGC领域,亚马逊云科技绝对有实力做基础大模型和大语言模型,但更聚焦在如何打造强大的AIGC云底座,推动AIGC技术普惠化。

近期亚马逊云科技在AIGC领域的四项技术创新

在云上,完全托管和轻松定制AIGC服务

面对爆发式增长的AIGC技术,企业客户的核心需求有哪些?此前,亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian在署名文章中表示:

“客户向我们讲述了他们现在的主要需求:第一、直接找到并访问高性能基础模型;第二、无缝与应用程序集成,且无需管理大量基础设施集群,也不会增加过高的成本。第三、能够轻松上手,基于基础模型,利用自己的数据(可多可少)构建差异化的应用程序。

亚马逊云科技在AIGC领域的布局正是围绕这些核心需求展开。

AIGC服务Bedrock是一项全托管的服务,用户可以通过API访问当前主流的AIGC大模型,包括来自AI21 Labs、Anthropic、Stability AI的基础模型,以及亚马逊自有的基础模型Titan。

 Amazon Bedrock目前支持的基础模型

完全托管和轻松定制是Bedrock独特的优势。用户无需担心实例类型、网络拓扑和端点等基础设施细节。同时用户只要在Amazon S3中提供少量(低至20个)带标签的示例,就可以轻松定制Bedrock的基础模型,用于其特定用例。”陈晓建表示。

基础模型Titan包括了两个全新的大语言模型。其中,Titan Text专注于生成式NLP任务,比如写总结、创作博客、文字分类、对话和信息提取等;Titan Embeddings用于搜索和个性化等,可将文本输入翻译成包含语义的嵌入编码能够让搜索结果更相关和符合上下文语境,目前Amazon.com的产品搜索中已经用上了类似的文本嵌入模型。

AI编程助手CodeWhisperer现已面向所有个人开发者免费开放, 适用 Python、Java、JavaScript、TypeScript 和 C#之外,新增支持Go、Kotlin、Rust、PHP 和 SQL等10 种开发语言。CodeWhisperer可显著提高开发者的生产力,在预览期间可提高57%的任务完成速度和27%的任务成功率。

“我们相信生成式AI将改变开发者的游戏规则,因此希望它能为尽可能多的人所用。”Swami表示。

“开发者可以通过注释的方式与CodeWhisperer交互。一般写代码的时候我们都会给自代码加注释,在注释写 “请帮我生成一段上传图片到云端的代码”,它就会给出这一段代码的建议,如果我们都接受的话,就只需要按一下Tab键,就相当于接受了建议。这样的交互体验使得CodeWhisperer更像是开发者的智能助手。”亚马逊云科技大中华区数据技术专家团队总监王晓野表示。

 

AIGC时代,最大化云底座优势

AIGC发展的瓶颈在于算力已经成为业界共识,而更具性价比的算力是AIGC高速发展的基础。

此次,亚马逊云科技进一步升级了算力性价比。目前,基于Amazon Trainium芯片的新型Trn1n和基于Amazon Inferentia2芯片的Amazon EC2 Inf2实例正式可用。

由Trainium支持的Trn1计算实例与其他任何EC2实例相比,都可以节省高达50%的训练成本。以一个具备万亿级参数的大模型进行两周训练为例,GPU服务器P3dn需要600个实例,最新一代GPU实例P4d需要128个实例,但Trn1只需要用96个实例。

由Amazon Inferentia2支持的Inf2实例,是唯一一个专门为大型Transformer模型分布式推理建立的实例。与上一代实例相比,Inf2实例提供高达4倍的吞吐量,降低多达10倍的延迟。与基于GPU的实例相比,每瓦性能提升高达45%,同时也支持诸如GPT类型的大型复杂模型,并且可以用单实例实现1750亿参数模型的推理。

目前,众多领先的AIGC企业都在基于亚马逊云科技的基础设施进行创新。

在AI绘画领域,推出开源AI模型Stable Diffusion的AIGC独角兽Stability AI,就在利用亚马逊云科技上的大规模GPU集群和Amazon Trainium机器学习训练芯片组成的高性能计算集群来训练其生成式AI基础模型,并通过云上模型训练的弹性来优化成本,最终将其使用的GPT-NeoX等开源语言模型的训练时间和成本减少58%。

“今天,基础模型花费的时间和金钱主要用于训练,这是因为许多客户才刚刚开始将基础模型部署到生产中。但是,未来当基础模型进入大规模部署时,大部分成本将用于运行模型和进行推理。” 谈到未来训练和推理对于算力资源的需求时,Swami如此表示。

写在最后

谈到亚马逊云科技在AIGC领域的独特优势,陈晓建表示主要有三点:

第一, 降低客户在大规模训练和部署方面的难度,降低AI创新的门槛;

第二, 提供多样化的模型选择,包括第三方模型和自己研发的模型;

第三, 强大的安全能力,确保客户在训练和部署定制化模型时的数据安全。

亚马逊云科技认为,目前生成式AI模型主要集中在文本和图片生成,正在逐步渗透到音频和视频内容生成,未来将出现越来越多的跨模态/多模态内容生成。

“我们正处在一个令人激动的机器学习被大规模采用的转折点上,我们也相信生成式AI将会重塑大量客户体验和应用程序。” Swami总结道。

文中图片来自摄图网

END

本文为「智能进化论」原创作品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/472497.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

万应低代码4月重点更新内容速递

低代码开发能力提升 分布式缓存支持 万应提供了一套分布式的缓存系统,可在多个节点之间共享缓存数据,从而加速数据获取速度,提高应用的性能和效率。包含: 缓存设置节点:把需要高频访问的数据写入到缓存中,并…

vue3 vue.config.js配置Element-plus组件和Icon图标实现按需自动引入

打包时,报警告,提示包太大会影响性能 1.配置前包体积: 2.安装插件: npm i unplugin-auto-import unplugin-vue-components unplugin-icons -D 3.vue.config.js中加入以下配置: const { defineConfig } require(vu…

Vue3 Antd 父子嵌套子表格

Vue3 Antd 父子嵌套子表格 父子嵌套子表格 目标1:可以点击多个父节点表格,正确显示子表格数据 目标2:父表格数据刷新重载,解决子表格数据不刷新问题 官方示例代码,以及效果 https://www.antdv.com/components/tabl…

linux0.12-8-2-asm.s

[290页] 8-2 asm.s程序 8-2-1 功能描述 1、 我们先考虑c)、 d) 2、无出错码 2.1、 将要执行的处理函数压栈; 2.2、 eax被交换入栈。现在eax护理函数 2.3、 其他寄存压栈 2.4、 立即数0压栈 2.5、 取edxEIP后,将edx压栈 2.6、 段寄存器都设置0x10段选…

通过身份个性化网络(IPM)实现真实世界的自动化妆

来源:投稿 作者:小灰灰 编辑:学姐 论文标题: Real-World Automatic Makeup via Identity Preservation Makeup Net 论文链接:https://www.ijcai.org/proceedings/2020/0091.pdf论文代码:https://github.co…

XRSPACE 总经理刘冠廷:元宇宙行业如何通过 2D、3D 联动,实现高速用户增长?

序言: 元宇宙领域创业并非坦途,似乎已经成为了行业共识。 即使到今天,VR/AR 领域的装备开支和上手学习成本居高不下,全球整体用户体量相比移动互联网也仍属早期阶段。 在这样的背景下,元宇宙公司如何持续且快速地获…

python毕业设计之django+vue流浪宠物动物救助领养网站

开发语言:Python 框架:django Python版本:python3.7.7 数据库:mysql 数据库工具:Navicat 开发软件:PyCharm 网站前台: 站内新闻:针对网站的新闻信息进行展示,能够展示…

简单聊聊Echarts伪3D地图实现的相关配置

知识和技能真的是用进废退,还是得多实践,才不至于遗忘。 目录 前言 二、实现原理 三、从0开始实现 1.目录结构 2.地图JSON数据获取 3.具体实现,重头戏 3.一些常见问题的解决方法 总结 前言 本文简单来聊一聊Echarts伪3D地图的实现&a…

Java面试被问Spring哑口无言?100道Spring面试考点解析

对于开发同学来说,Spring 框架熟悉又陌生。 熟悉:开发过程中无时无刻不在使用 Spring 的知识点;陌生:对于基本理论知识疏于整理与记忆。导致很多同学面试时对于 Spring 相关的题目知其答案,但表达不够完整准确。今天展…

UE4蓝图学习篇(八)-- 角色基础移动

在C学习篇中有介绍如何使用UE4C去处理角色的基础移动,那么本篇介绍使用蓝图去处理角色的基础移动。 1、创建Character类; 添加一个SpringArmComponent组件,在其下方添加一个CameraComponent组件能够看到角色,SpringArmComponent的…

奥斯汀独家对话|从机构的「拉扯」中成长的美国加密监管

‍前言 4月25日,在美国得克萨斯州的首府奥斯汀,这座充满活力和创造力的城市,欧科云链研究院与来自哥伦比亚商学院的Austin Campbell教授就美国加密监管以及其相关话题进行了一次深入探讨。双方讨论了美国整体的监管问题、监管逻辑、最新的稳…

华为孟晚舟当值首秀:2030年AI算力将增长500倍!

作者 | 范智林 来源 | 华商观察 微信号:HuashangGC 孟晚舟当值首次亮相。 4月19日,华为副董事长、轮值董事长、CFO孟晚舟在华为第20届全球分析师大会上进行演讲,这是她当值华为轮值董事长以来的首次公开亮相。 按照华为内部规定&#xff0c…

展会预告 | 昂视诚邀您届时莅临CIBF2023深圳国际电池展

CIBF2023深圳国际电池展将于5月16日在深圳国际会展中心(宝安新馆)举行,作为国际电池行业规模最大的会展活动,它是了解电池行业的重要窗口,也是中国电池产业链企业连接全球产业界的重要桥梁和平台。 昂视作为制造自动化…

一文彻底分清ARM架构、内核、指令集等相关概念

任何学习嵌入式/单片机的朋友都绕不开ARM,但初学者总是对ARM架构、内核、指令集等相关概念不够清晰或者混淆,本文帮助入门的朋友彻底弄清楚。 目录 1.芯片、CPU、SOC 2.ARM公司 3.ARM架构与内核、指令集 3.1架构与内核 3.2架构与指令集 4.ARM架构…

操作系统——概述

目录 1.1初识操作系统 思考题: 1.2操作系统的功能和定义 思考题: 1.3操作系统发展史 思考题: 1.4分时技术 思考题: 1.5典型操作系统类型 1.1初识操作系统 常见桌面级别的四大操作系统:Windows、Mac OS、Linu…

swift 技术 音频

一直觉得自己写的不是技术,而是情怀,一个个的教程是自己这一路走来的痕迹。靠专业技能的成功是最具可复制性的,希望我的这条路能让你们少走弯路,希望我能帮你们抹去知识的蒙尘,希望我能帮你们理清知识的脉络&#xff0…

【测试开发】单元测试、基准测试和性能分析(以 Go testing 为例)

一、为什么需要测试🤔️ 你写不出 bug-free 的代码。你认为自己写出了 bug-free 的代码,但它在你意想不到的地方出错了。你觉得自己写出了永不出错的代码,但它的性能十分糟糕。 二、在开发过程中做好测试(理想情况下)…

PLC模糊PID模糊规则矩阵(梯形图语言实现)

博途PLC的模糊PID控制详细内容请查看下面的博客文章: Matlab仿真+博途PLC模糊PID控制完整SCL源代码参考(带模糊和普通PID切换功能)_博途怎么实现模糊pid_RXXW_Dor的博客-CSDN博客模糊PID的其它相关数学基础,理论知识大家可以参看专栏的其它文章,这里不再赘述,本文就双容…

mysql实现存在则保存,不存在则更新

方式1 ON DUPLICATE KEY UPDATE 使用前提:表必须配置唯一键或者主键,且保存的字段中包含该键【重点】 原理: ON DUPLICATE KEY UPDATE如果配合主键,存在数据a,新插入b,如果主键不冲突,会保存b…

[React] useRef用法和特性

useRef 与 useState 的区别 一般在使用react-hook的时候&#xff0c;我们用到最多的就是定义变量&#xff0c;以及对应的修改变量 下面是一个最基本的 react-hook 应用程序 const Home () > {const [username, setUserName] useState();return &#xff08;<input va…