摆脱基础设施束缚,亚马逊云科技提出生成式AI方法论

news2024/11/28 4:19:55

“未来近在咫尺,只不过时隐时现 (The future is here, it's just not evenly distributed yet.)”--亚马逊云科技全球产品副总裁Matt Wood博士引用“赛博朋克之父” William Gibson 的一句名言来表达生成式AI的发展现状。

自去年底ChatGPT惊艳众人开始,这场已经持续半年并席卷全球的生成式AI浪潮并未有停止的迹象,反而是愈演愈烈,国内甚至上演了百模大战的盛况。越来越多公司或者行业用户意识到大模型可能带来的改变,于是纷纷跃跃欲试。但大模型是一项极为复杂的工程化问题,涉及一系列的难题,首当其冲的就是基础设施带来的挑战。

如何应对生成式AI对于算力、数据、微服务等基础设施领域一系列挑战。在近日的2023年亚马逊云科技中国峰会上,亚马逊云科技全球产品副总裁Matt Wood博士、亚马逊云科技大中华区产品部总经理陈晓建等专家带来了亚马逊云科技的真知灼见。

面对井喷的算力需求,亚马逊云科技是这么看的

毫无疑问,算力是当下生成式AI面临的首要难题。

都说算力、算法和数据是人工智能发展的三要素,虽然这些年AI算力占比在持续提升,但动辄需要消耗上万CPU和GPU卡的大模型依然带来了巨大的算力缺口,以及如何让算力更好地与大模型、生成式AI应用匹配、应用。

 “当前,虽然生成式AI只有短短几个月,但其超大规模人工智能模型和海量数据对高算力提出新要求,不断拉动算力需求快速增长。”马逊云科技大中华区产品部总经理陈晓建如是说。

为解决生成式AI带来的算力挑战,亚马逊云科技的思路是通过自研芯片、各种丰富且弹性的计算、网络、存储组合以及Serverless架构,全面满足用户的多样化的算力需求。另外对于全球布局,亚马逊云科技提供从中心到边缘的多种产品的解决方案,包括覆盖全球的基础架构,以及快速部署稳定系统的能力,还有全面支持全球各个国家和地区业务合规能力,为企业打造了坚实的底层架构基石。

首先是亚马逊云科技自身强大的基础设施能力,提供包括Intel、AMD、英伟达,和自研的CPU及加速芯片等丰富的算力产品。在自研芯片方面,2015年开始,亚马逊云科技开始布局自研芯片,如今已经具备了包括虚拟化系统、云原生处理器和机器学习训练及推理等多款自研芯片。

比如,亚马逊云科技自研芯片 Amazon Graviton,Graviton 目前已经发展到 3E,相比之前的产品,Graviton3E 计算性能提高25%,浮点性能提高2倍,加密工作负载性能加快2倍;Graviton3E 特别关注向量计算的性能,跟前一代相比提升了35%。这个性能提升对于像 HPC、AI等应用来说尤为重要。

其次,亚马逊云科技提供丰富且高度弹性的算力资源,能够提供丰富的计算实例以满足生成式AI的多样性算力续期。当前,亚马逊云科技提供600多种不同的计算实例,从处理器、网络和存储等各种服务都能够与计算进行很好的结合,以积木的方式搭建出一个丰富灵活的计算实例的资源,满足多种不同算力的要求。

Weta Digital(维塔数码)是全球领先的综合性视觉效果公司,亚马逊云科技为Weta Digital提供了各种从算力资源到云上制作的堆栈,机器学习的堆栈等等一系列的服务,提供非常强的伸缩性以及很好的性价比:《阿凡达1》的时代花了整整14个月才看到了第一帧,《阿凡达2》8个月跑了33亿个线程小时。

第三,针对大规模算力应用带来复杂性,亚马逊云科技推动云服务全面迈向Serverless,亚马逊云科技已经实现了全栈数据服务的Serverless化,开启了云服务全面Serverless的时代,让企业无需预置或管理基础设施,就可以运行几乎任何类型的应用程序或后端服务代码,可最大限度减轻运维工作,并增加业务敏捷性,更好地应对业务的各种不确定性。

如今,亚马逊云科技已经相继发布了105多种 Serverless 新技术,包括:解决 Java 应用冷启动问题的 Lambda SnapStart,可视化编辑器 Application Composer 等。用户可以根据应用的类型来选择不同的弹性和计算颗粒度。

第四,亚马逊云科技自身具有全球领先的数据中心基础设施布局,在全球拥有31个区域的99个可用区,已经覆盖了245个国家和地区,全方位助力企业实现全球化布局,可以将亚马逊云科技的基础架构扩展到几乎任何数据中心或用户的本地设施,提供真正一致的混合体验。另外,亚马逊云科技在大部分服务中采用蜂窝架构设计,把系统分割成多个蜂窝状单元,通过控制爆炸半径,降低故障发生时对整体系统的影响。随机分片思路则对蜂窝架构进行了进一步优化,把故障影响降到更低。

比如,OPPO 希望全球业务独立运作、区域合规自治,同时又有统一的管理。在使用亚马逊云科技的 Cloud WAN 广域网服务之后,OPPO 可通过本地网络提供商,连接到亚马逊云科技,通过中央控制面板和网络策略在分钟就可以建立起一个覆盖全球的自己的专用网。

亚马逊的生成式AI方法论

众所周知,过去半年里,全球都看到了生成式AI的爆发,大语言模型可以接受复杂的输入,并产生复杂的输出。

事实上,生成式AI的爆发是大数据、深度学习、人工智能等技术发展到阶段性之后的结果。那么,对于想进入到生成式AI领域的众多用户,是否会有一套先进的方法论来让他们少走弯路?

对此,为客户提供广泛的机器学习能力方面有着悠久历史的亚马逊云科技总结出生成式AI的方法论。Matt 博士认为:“生成式AI在重塑各行各业,它可以突破以前无法突破的极限。比如创意输出,如写作、设计、编码、建模等。解锁生成式AI价值、云原生数据战略、切实可行的方法是生成式AI发展的关键。”

如何抓住机遇、充分释放生成式 AI 的核心价值?为了帮助更多用户解锁解锁生成式AI的价值。亚马逊云科技的应对策略有四点:利用一流的基础模型,构建出色的生成式 AI 应用程序;安全私密的环境,便于使用私有数据定制化这些模型;低成本、低延迟的技术,借助专门构建的机器学习基础设施;借助专业代码生成工具,消除繁重工作并提高效率。

“ Amazon Bedrock,能够帮助用户将数据用基础模型通过无服务器化的 API 来实现,无需管理相应的基础架构;同时,也有为开发人员提供的代码生成服务:基于机器学习的 Amazon CodeWhisperer,它能够更快、更安全地构建应用程序,为构建者提供简单使用自然语言编写的工具,帮助团队高效率、高质量完成任务。”Matt 博士介绍道。

此外,生成式AI需要海量数据进行训练。但海量数据的清晰、整理、训练和推理依然是一项极为复杂的工作。亚马逊云科技认为,云原生数据战略对于生成式AI具有重要作用。云原生战略包括:云原生数据战略的核心特征是: 全面的工具集,满足现在和未来所需; 轻松集成,连接所有数据;构建端到端的数据治理。

为此,亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供完美契合的数据服务;亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码;亚马逊云科技去年推出的一项全新的数据管理服务Amazon DataZone,可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。

此外,Matt 博士认为,使用数据开启生成式AI旅程还需要无条件:基于自己现有的数据战略去做构建;在组织内实现更广泛、更安全的生成式AI实验;为需求场景定制化模型;携手亚马逊云科技,探索无限可能;选择场景,即刻启程,构建未来。

“技术能力往往遵循S曲线。你永远不知道你在S曲线上的位置,除非你向后看。明年回头看的时候,我们看到生成式AI也许达到S曲线的顶点,达到快速爆发式发展的点,涌现出大量发明和应用。”Matt 博士最后表示道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/749122.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

云原生高性能API网关,选Apache APISIX还是Nginx Plus

文章首发地址 Apache APISIX 对比 Nginx Plus APISIX 和 Nginx Plus 都是高性能的 API 网关,具有类似的特点,如可扩展性、插件化、负载均衡、反向代理等。下面对 APISIX 和 Nginx Plus 进行对比: 开源授权:APISIX 是 Apache 开…

Java阶段五Day05

Java阶段五Day05 文章目录 Java阶段五Day05问题解析无法启动Naocs Nacos服务注册发现Nacos运行架构nacos-server是一个服务进程 配置注册服务端客户端csmall-for-jsd-business-adapter 整合nacos-clientyaml详细配置注册信息在nacos中的内存状态多实例注册服务抓取(…

五大引擎全新升级!轻流 5.0 正式发布

轻流的5.0版本,一个“陪伴企业成长的一站式开发平台”,它将更加灵活、更加开放,同时更加低门槛。 ——轻流联合创始人&CPO 严琦东 7月6日,在一年一度的无代码无边界 202376Day 轻流无代码探索者大会上,轻流联合创…

SpringMVC实现对页面的访问和跳转~

初识MVC: MVC是一种软件架构的思想,将软件按照模型,视图,控制器来划分 M:Model,模型层,指工程中的JavaBean,作用是处理数据 JavaBean分为两类: 一类称为实体类Bean:专门存储业务数据的&…

Java 中线程相关的各种锁

一、Java对象与锁 1、对象结构 2、对象头的 Mark Word 二、锁介绍 1、概念和种类 1、乐观锁 不加锁,在使用数据时判断数据是不是最新。常用CAS算法实现 2、自旋锁 与 适应性自旋锁 两者并不是锁,而是锁提供的处理方式。 自旋锁(JDK1.4&a…

Sentinel 熔断与限流

文章目录 1 是什么?2 特征3 特性4 与Hystrix的区别5 两个部分6 应用6.1 依赖6.2 配置文件 7 流量配置规则7.1 直接(默认)7.2 关联7.3 Warm Up 预热7.4 排队等待 8 熔断降级8.1 概述RT(平均响应时间,秒级)异常比列(秒级)异常数(分钟…

python-cv2模块安装

1.自动安装 如果网络环境好: pip install opencv-python2.卸载与安装指定版本 卸载opencv pip uninstall opencv-python安装指定版本的cv 指定版本为:4.5.4.60 pip install opencv-python 4.5.4.603.下载安装包安装 从官网下载正确安装包安装&#x…

【Linux工具】编译器、调式器、项目自动化构建工具以及git的使用2(make/makefile和git的基本使用)

【Linux工具】编译器、调式器、项目自动化构建工具以及git的使用2(make/makefile和git的基本使用) 目录 【Linux工具】编译器、调式器、项目自动化构建工具以及git的使用2(make/makefile和git的基本使用)背景make和makefile的用法…

Proxy-Reflect使用详解

1 监听对象的操作 2 Proxy类基本使用 3 Proxy常见捕获器 4 Reflect介绍和作用 5 Reflect的基本使用 6 Reflect的receiver Proxy-监听对象属性的操作(ES5) 通过es5的defineProperty来给对象中的某个参数添加修改和获取时的响应式。 单独设置defineProperty是只能一次设置一…

AppStorage, OnboardingView 的示例

1. AppStorage 数据简单存储的实现 /// 应用程序数据简单存储 struct AppStorageBootcamp: View {//State var currentUserName: String?AppStorage("name") var currentUserName: String?var body: some View {VStack(spacing: 20) {Text(currentUserName ?? &…

Ghostscript开源PDF库中发现关键漏洞

在Linux中广泛使用的PostScript语言和PDF文件开源解释器Ghostscript被发现存在严重远程代码执行漏洞。 该漏洞被标记为CVE-2023-3664,CVSS v3评级为9.8,影响10.01.2之前的所有Ghostscript版本,10.01.2是三周前发布的最新版本。 据Kroll公司…

深入理解netfilter和iptables

目录 Netfilter的设计与实现 内核数据包处理流 netfilter钩子 钩子触发点 NF_HOOK宏与Netfilter裁定 回调函数与优先级 iptables 内核空间模块 xt_table的初始化 ipt_do_table() 复杂度与更新延时 用户态的表,链与规则 conntrack Netfilter(结合iptable…

基于C语言设计的足球信息查询系统

完整资料进入【数字空间】查看——baidu搜索"writebug" 需求分析与概要设计 2.1 项目说明 我们小组的选题主要是面向足球爱好者,在普通社交软件的基础之上,围绕足球的主题展开设计,以便于他们能够更好的交流相关的话题&#xff…

高效编程的捷径:HbuilderX的独特之处

目录 引言HbuilderX的功能HbuilderX的优点HbuilderX的缺点总结 HBuilderX 官网 引言 在当今科技发展日新月异的时代,软件开发已成为一个极富挑战性且高需求的领域。为了在竞争激烈的市场中脱颖而出,程序员们需要掌握一系列高效编程的技巧和工具。在这个过…

谈一谈LLM在推荐域的一些理解

作者:陈祖龙(葬青) 一、前言 最近大模型真的很火,从个人到公司,各行各业都在学习大模型、总结大模型和尝试应用大模型。大模型其实不是一个新的产物,已经在NLP发展了很多年。ChatGPT的诞生,经验的效果震惊了所有人&…

ES系列--es初探

一、前言 一般传统数据库,全文检索都实现的很鸡肋,因为一般也没人用数据库存文本字段。进 行全文检索需要扫描整个表,如果数据量大的话即使对 SQL 的语法优化,也收效甚微。建 立了索引,但是维护起来也很麻烦&#xff0…

人工智能-电脑如何像人一样思考?

发展历史 在电影如 终结者、机械公敌 中,机器人为什么能够像人一样思考?其实这就是人工智能。人工智能多方面:例如人脸识别系统、肺部影响CT,手机中的美颜、垃圾邮件拦截、自动驾驶 。 上世纪30-50年代,随着计算机科…

服务器如何查库磁盘情况?

查库磁盘情况 du -h --max-depth1 ./ | sort -hr

九九乘法表案例

for循环嵌套 代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</titl…

Linux5.15 Zookeeper集群 + Fafka集群

文章目录 计算机系统5G云计算第四章 LINUX Zookeeper集群 Fafka集群一、Zookeeper1.Zookeeper 概述1&#xff09;Zookeeper 定义2&#xff09;Zookeeper 工作机制3&#xff09;Zookeeper 特点4&#xff09;Zookeeper 数据结构5&#xff09;Zookeeper 应用场景6&#xff09;Zoo…