百度侯震宇:AI原生与大模型将从三个层面重构云计算

news2024/11/15 17:47:04

12月20日,2023百度云智大会·智算大会在北京举办,大会以「大模型重构云计算,Cloud for AI」为主题,深度聚焦大模型引发的云计算变革。
 

百度智能云表示,为满足大模型落地需求,正在基于「云智一体」战略重构云计算服务,目前已完成从底层基础设施—大模型开发与应用—AI原生应用开发的端到端升级重构:全面升级百舸等20多个云计算基础设施、千帆大模型平台再升级、AI原生应用开发工作台“千帆AppBuilder ”全面开放。
 

智算大会现场,百度智能云还公布了最新“成绩单”。自8月31日文心大模型向全社会全面开放以来,在千帆大模型平台上,大模型API日调用量增长10倍。目前千帆平台已经累计服务超过4万家企业用户,累计帮助企业用户精调近1万个大模型。相较于自建系统训练大模型,使用千帆平台训练的成本最高可以下降90%。

大模型正在重构云计算

“AI原生时代开启,大模型正在驱动云计算产业创新变革。”百度集团副总裁侯震宇表示:“大模型重构云计算主要体现在三个层面:AI原生云将改变云计算的格局,模型即服务(MaaS )会成为新的基础服务,AI原生应用催生新的研发范式 。”
 

首先,在云基础设施层,移动互联网时代的应用,底层大多依赖CPU算力,而AI应用对GPU或异构计算的需求大幅增加,云市场的底层算力需求将逐渐转向以GPU为主。
 

其次,在模型层,大模型正在成为通用的服务能力,即MaaS。MaaS将大幅降低Al落地的门槛,实现真正的Al普惠。
 

最后,在应用层,应用开发的范式已经被彻底颠覆。大模型理解、生成、逻辑、记忆的独特能力会催生A原生应用研发新范式,整个应用技术栈、数据流和业务流都将被改变。

百度集团副总裁侯震宇
 

侯震宇表示,总体来说,构建繁荣的A原生应用生态,需要大模型、智能算力、AI原生应用研发新范式三要素相辅相成。大模型是AI原生应用的“大脑”,智能计算则为A原生应用运行提供坚实支撑,新研发范式助力开发者高效基于大模型能力开发应用。数据飞轮是成功的AI原生应用的充分必要条件,让大模型能力高速迭代,产品体验持续进步。

云计算全面升级:五大领域20余款全栈产品集中发布
 

AI原生时代,面向大模型的云计算基础设施体系将全面重构。侯震宇表示,百度智能云将在三大方面重构云计算服务,即:面向模型的智算基础设施、面向数据的数据基础设施、面向应用的云基础设施,以支撑AI原生应用落地。
 

大会现场,百度智能云密集发布和升级了20多款云计算产品,涵盖智能计算、通用计算、数据库和大数据、分布式云、应用开发平台五大领域。
 

在智能计算领域,算力是大模型落地的基础条件,当前大模型训练、推理、部署对高速互联、计算效率、算力成本等都提出了高要求,需要打造新型的智算基础设施。但目前的计算集群还面临不少挑战,大模型训练时间长、易出错、稳定性差,算力集群规模大、系统复杂度高也增加了运维难度。

全新发布的百度百舸·AI异构计算平台3.0,针对AI原生应用以及大模型的训练、推理等环节进行了专项优化。百舸3.0在稳定、高效、易运维三个方面大幅升级产品能力,实现万卡级别任务有效训练时长达到98%以上,带宽有效性可达 95%。相比自建智算基础设施,可以实现模型训、推吞吐分别最高提升30%和60% 。
 

百度百舸3.0发布


针对AI原生时代智能算力的供给平衡问题,百度智能云发布智算网络平台。在算力资源层面,智算网络平台支持将百度及第三方建设的智算中心、超算中心、边缘节点等智算节点进行全域接入,将分散和异构的算力资源连接起来,形成统一的算力网络资源池,再通过百度自主研发的算力调度算法,智能分析各类算力资源的状态、性能和利用率等指标,统一调度算力,让智算资源灵活、稳定、高效地交付给有需求的用户,实现智算资源的“南水北调”。
 

在通用计算领域,计算、存储、网络等云原生基础设施也需要面向AI原生时代重构升级,提供更具弹性、高性能和智能化的运维能力。
 

本次大会,百度太行·计算新增了三款计算实例:全新推出第7代(通用计算型)云服务器实例G7,综合性能较上一代产品提升10%;发布昆仑芯弹性裸金属实例NKL5,搭载了百度自研的昆仑芯R300加速处理器,在大模型推理场景综合性能较业界主流加速卡可提升达50%;发布基于昇腾910B加速处理器打造的弹性高性能计算实例NH6T,在大模型训练场景中,综合性能较业界主流加速卡提升可达40%。
 

同时,高性能计算平台CHPC(Cloud HPC)正式发布,为用户提供的一站式公共云 HPC 服务。在资源使用层面,CHPC支持用户一键创建高性能计算环境,并根据业务变化灵活使用云上资源;在业务应用层面,CHPC支持集成药物研发、基因测序等行业的应用。此外,结合集成在 VPC 内的百度网盘等服务,用户可以轻松实现HPC源文件从提交、上传、处理、结果回传,到分发的数据全链路打通,助力研发提效。
 

在分布式云方面,百度智能云带来三大升级:边缘计算节点BEC产品能力升级,打造全球统一的边缘计算网络和产品体验,打造AI原生应用时代能力最完善的“云边一体”;专有云ABC Stack新能力发布,支持本地部署百度智能云千帆大模型平台;本地计算集群LCC新能力发布,支持全新一代CPU/GPU实例以及完整的百度智能云AI&HPC集群管理能力,进一步丰富完善基础设施与云产品支持能力矩阵。
 

大模型落地不仅需要算力支持,还需要对各类数据和海量的知识进行存储、管理和分析工作。百度智能云在云存储、云原生数据库、大数据平台等数据基础设施领域发布了一系列重磅新品。
 

百度沧海·存储,统一技术底座正式发布,能够支持各类存储产品,同时满足AI原生时代的大规模、高性能、低成本的存储要求。全新升级的对象存储BOS、云磁盘CDS、并行文件存储PFS等产品,面向数据湖存储和AI存储能力进行了全面增强,加速智能计算,释放数据价值。
 

云原生数据库GaiaDB 4.0版本正式发布,增强并行查询能力,突破单机计算瓶颈,实现跨机多核并行查询,在混合负载和实时分析业务场景中性能提升超过10倍;针对不同的工作负载推出列存索引和列存引擎,提升不同规模数据的查询速度,其中列存引擎最大可支持 PB 级数据的复杂分析,并且与事务处理业务严格复杂隔离;通过共识协议优化、链路优化、自适应动态回放存储多版本等一些列数据流深度优化,大幅提升GaiaDB整体性能60%以上。
 

大会期间,杭州吉利易云科技有限公司总经理成品耀,分享了吉利集团携手百度智能云的打造集团专有云,打造数字基建底座。目前吉利集团已实现车联网、生产制造业务上云,且正在基于这套高效、稳定的基础设施平台构建企业级AI大模型能力,全方位赋能集团业务。
 


杭州吉利易云科技有限公司总经理成品耀

模型即服务(MaaS):千帆大模型平台再升级
 

在AI原生时代,大模型将作为新的通用服务能力,由模型即服务(MaaS)平台提供给广大用户。百度智能云千帆大模型平台(以下简称“千帆平台”)作为业界领先的MaaS服务平台,预置了包括百度文心大模型在内的、国内最多的54个主流基础大模型和行业大模型,还为大模型的持续预训练、精调、评估、压缩和部署等环节提供最完善易用的工具链,帮助客户针对自身业务场景快速定制专属大模型。相较于自建系统训练大模型,使用千帆平台训练的成本最高可以下降90%

百度智能云千帆大模型平台
 

目前,千帆平台已经累计服务超过40000家企业用户,精调近10000个大模型。本次智算大会,针对客户应用大模型最关心的“提效”和“降本”两大核心诉求,千帆平台发布一系列全新功能。


在数据方面,千帆平台提供完善、高效的大模型数据管理工具链,包括数据采集,清洗、自动标注、自动增强与推理数据多位评估等功能,助力用户快速构建自身业务“数据飞轮”,实现反馈驱动增长。全新发布的数据统计分析、数据质量检查等功能,支持用户获取全方位的数据洞察信息,结合数据清洗可视化Pipeline,能够构建出面向大模型场景的高质量数据燃料,为大模型训练“保驾护航”,千帆也因此成为国内首个支持大模型多方位数据分析的MaaS服务平台。
 

作为模型部署上线前的“最后一公里”,模型评估能够对大模型的输出效果、计算性能等进行全方位评估,确保大模型上线后AI原生应用的效果稳定可靠。千帆平台创新性地引入自动化与人工结合的双重评估机制,充分发挥双方优势,大幅提升模型评估效率与质量。一方面,百度文心大模型作为AI裁判员,能够对被评估模型的回答进行自动化打分,极大程度地减少海量重复性人工作业;另一方面,由数据标注员/业务专家对大模型回答进行打分,则能够实现对大模型回答质量的精细化衡量。
 

此外,千帆平台灵活的计价方式,如Tokens(适用灵活性要求较高的业务)、TPM(Tokens per Minute,适用于较大并发量业务)、批量计算(适用于离线内容生产等对实时性要求较低,吞吐较大的任务)、算力单元(适用于需要专享硬件部署模型的客户)等,可以轻松满足客户的多种业务场景需要,助力企业低成本用好大模型。

赋能AI原生应用开发:千帆AppBuilder正式开放服务
 

为了满足企业敏捷、高效地进行AI原生应用开发的需求,降低AI原生应用开发门槛,百度智能云千帆AppBuilder正式开放服务。

AppBuilder
将大模型开发AI原生应用的常见模式、工具、流程,沉淀成一个工作台,帮助开发者聚焦业务本身,而无需为开发过程牵扯多余精力。具体来讲,AppBuilder主要由组件、框架两层服务构成。
 

「组件」服务由多模态的AI能力组件(如文字识别、文生图等)、基于大语言模型的能力组件(如长文总结、nl2sql等)、基础组件(如向量数据库、对象存储等)三部分组成,是对底层服务能力的组件化封装,让每个组件完成一个特定的功能。
 

「框架」则是通过将上述这些组件有选择地串联、组合起来,让它们能够比较完整地完成一个特定场景的任务。目前,AppBuilder提供的检索增强生成(RAG)、智能体(Agent)、智能数据分析(GBI)就是常用的AI原生应用框架。
 

AppBuilder提供两种产品形态,代码态与低代码态。对于有深度AI原生应用开发需求的用户,AppBuilder代码态提供包括SDK、开发环境、调试工具、应用示例代码等各种开发套件和应用组件;而AppBuilder低码态则提供可视化工具,用户只需简单点选,即可快速定制、上线AI原生应用。

百度智能云千帆AppBuilder
 

百度创始人、董事长兼首席执行官李彦宏认为,繁荣的AI原生应用生态,会驱动经济增长。今年10月,百度智能云推出了国内首个大模型全链路生态支持体系,为合作伙伴提供包括赋能培训、AI原生应用孵化、销售商机、市场营销等全方位的支持,致力于繁荣AI原生应用生态。
 

侯震宇预判,2024年将成为AI原生应用的元年,迎来AI原生应用的爆发式增长。百度智能云将持续推出有竞争力的产品方案,与伙伴一起深耕客户应用场景,让更多的AI原生应用创新涌现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1325044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Xcode 恢复Discard Changes

当开发的时候,Discard All Changes后 文件的修改都被放弃了,怎么才可以撤销更改呢 Xcode和Git没有这个功能,Finder可以实现 首先我们先退出Xcode用TextEdit打开你想恢复的文件转到文件 > 还原到 > 浏览所有版本...选择你想恢复的版本即…

亚信安慧AntDB:支撑中国广电5G业务的数据库之力

自2019年6月获得5G牌照以来,中国广电积极利用700MHz频谱资源,迅速崛起为第四大运营商,标志着其在数字通信领域取得的巨大成就。通过与中国移动紧密合作,共建共享基站已超过400万座,为实现自主运营和差异化竞争提供了坚…

vue2 组件传递数据

向子组件传递数据通过Props 1.创建子组件 详细步骤&#xff1a; 1.在components创建子组件 2.等父组件接受到参数后通过Props来接受父组件传递过来的数据 <template><div id"app"><h2>title:{{ title }}</h2><p>tips:{{ tips }}<…

java并发编程五 ReentrantLock,锁的活跃性

多把锁 一间大屋子有两个功能&#xff1a;睡觉、学习&#xff0c;互不相干。 现在小南要学习&#xff0c;小女要睡觉&#xff0c;但如果只用一间屋子&#xff08;一个对象锁&#xff09;的话&#xff0c;那么并发度很低 解决方法是准备多个房间&#xff08;多个对象锁&#xf…

idea中使用wsl作为启动项目的环境,便于linux环境下的测试

在idea中使用wsl作为启动项目的系统环境&#xff0c;首先安装wsl&#xff0c;这里不做过多的介绍&#xff0c;可以直接去微软官网看教程&#xff0c;也可以自己搜教程。 在wsl中安装jdk&#xff0c;linux中直接用命令安装openjdk即可 sudo apt-get updatesudo apt install ope…

ios微信小程序table头部与左侧固定双重滚动会抖动的坑,解决思路

正常情况是左右滑动时&#xff0c;左侧固定不动&#xff0c;上下滑动时表头不动&#xff1b;而且需求不是完整页面滚动。而是单独这个表滚动&#xff1b; 第一个坑是他有一个ios自带的橡胶上下回弹效果。导致滚动时整个表都跟着回弹&#xff1b; 这个是很好解决。微信开发官网…

在使用mapstruct,想忽略掉List<DTO>字段里面的,`data` 字段的映射, 如何写ignore: 使用@IterableMapping

在使用mapstruct,想忽略掉List字段里面的,data 字段的映射, 如何写ignore 代码如下: public interface AssigmentFileMapper {AssigmentFileDTO assigmentFileToAssigmentFileDTO(AssigmentFile assigmentFile);AssigmentFile assigmentFileDTOToAssigmentFile(Assigment…

Notepad++:多行数据操作

1&#xff09;删除关键字之后&#xff08;或之前&#xff09;的所有字符 删除s之后&#xff08;包含s&#xff09;的所有内容&#xff1b;快捷键&#xff1a;s.*$ 替换成功 删除s之前&#xff08;包含s&#xff09;的所有内容&#xff1b;快捷键&#xff1a;^.*s 2&#xff09…

MAC苹果笔记本电脑如何彻底清理垃圾文件软件?

苹果电脑以其流畅的操作系统和卓越的性能而备受用户喜爱。然而&#xff0c;随着时间的推移&#xff0c;系统可能会积累大量垃圾文件&#xff0c;影响性能。本文将介绍苹果电脑怎么清理垃圾文件的各种方法&#xff0c;以提升系统运行效率。 CleanMyMac X是一款专业的Mac清理软件…

语音识别之百度语音试用和OpenAiGPT开源Whisper使用

0.前言: 本文作者亲自使用了百度云语音识别,腾讯云,java的SpeechRecognition语言识别包 和OpenAI近期免费开源的语言识别Whisper(真香警告)介绍了常见的语言识别实现原理 1.NLP 自然语言处理(人类语言处理) 你好不同人说出来是不同的信号表示 单位k 16k16000个数字表示 1秒160…

智能优化算法应用:基于水基湍流算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用&#xff1a;基于水基湍流算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用&#xff1a;基于水基湍流算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.水基湍流算法4.实验参数设定5.算法结果6.…

Super访问父类成员

1 问题 当子类的成员变量或方法与父类同名时&#xff0c;可能模糊不清&#xff0c;应该怎么解决&#xff1f;如果子类重写了父类的某一个方法&#xff0c;我们又该怎么调用父类的方法&#xff1f; 2 方法 super调用成员属性&#xff1a; 当父类和子类具有相同的数据成员时&…

面向 NLP 任务的大模型 Prompt 设计

很久之前&#xff0c;我们介绍到&#xff0c;prompt是影响下游任务的关键所在&#xff0c;当我们在应用chatgpt进行nlp任务落地时&#xff0c;如何选择合适的prompt&#xff0c;对于SFT以及推理环节尤为重要。 不过&#xff0c;硬想不是办法&#xff0c;我们可以充分参考开源的…

小程序面试题 | 07.精选小程序面试题

&#x1f90d; 前端开发工程师&#xff08;主业&#xff09;、技术博主&#xff08;副业&#xff09;、已过CET6 &#x1f368; 阿珊和她的猫_CSDN个人主页 &#x1f560; 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 &#x1f35a; 蓝桥云课签约作者、已在蓝桥云…

语音识别与人机交互:发展历程、挑战与未来前景

导言 语音识别技术作为人机交互领域的重要组成部分&#xff0c;近年来取得了巨大的发展。本文将深入研究语音识别与人机交互的发展历程、遇到的问题、解决过程、未来的可用范围&#xff0c;以及在各国的应用和未来的研究趋势。我们将探讨在这个领域&#xff0c;哪一方能取得竞争…

47 星南二楼

动态规划&#xff0c;相当于求解最长子序列问题 #include <iostream> using namespace::std; using std::cout; using std::cin; int n; int a[5100],dp[5100];int xnel(int n, int a[]) {int result 0;for(int i0; i<n; i){for(int j0; j<i; j){if(a[j]<a[…

每日一博 - Protobuf vs. Protostuff:性能、易用性和适用场景分析

文章目录 历史区别联系性能差异最佳实践场景分析小结 历史 对于Protostuff和Protobuf的关系&#xff0c;需要了解它们的起源和发展。 Protobuf&#xff08;Protocol Buffers&#xff09;是由Google开发的一种数据序列化格式&#xff0c;用于结构化数据的存储和交换。它最初是…

损失函数中正则化中的平方项的作用!!

正则化上的平方项 前言在损失函数中添加正则化项时&#xff0c;通常会使用平方项作为正则化项&#xff0c;原因主要有以下几点&#xff1a; 前言 在损失函数中添加正则化项的原因主要是为了防止过拟合。正则化是一种常用的防止过拟合的技术&#xff0c;它可以对模型的复杂度进…

java反射的实战教程(简单且高效)

1. 参考 建议按顺序阅读以下文章 学了这么久的java反射机制&#xff0c;你知道class.forName和classloader的区别吗&#xff1f; Java反射&#xff08;超详细&#xff01;&#xff09; 2. 实战 2.1 通过Class.forName()方法获取字节码 这个方法会去我们的操作系统寻找这个cl…

linux、widnows的免费局域网桌面远程工具之NoMachine

统信UOS、银河麒麟及其他的linux桌面系统/windows系统都可进行远程桌面操作使用。 1.先到官网下载https://downloads.nomachine.com/自己使用的软件版本。 2.首先下载windwos端的的版本64位进行安装&#xff0c;安装是先暂时退出windows的杀毒软件&#xff0c;以免提示你各种确…