百度沈抖:智能,生成无限可能

news2024/11/19 11:19:09

4月16日,Create 2024百度AI开发者大会在深圳举行。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布新一代智能计算操作系统——百度智能云万源。它能管理万卡规模的集群,极致地发挥GPU、CPU的性能;它有强大的大模型作为核心引擎,构建起全面的大模型服务能力。它让应用开发像搭积木一样简单,提升AI原生应用的开发效率与体验,加速AI原生应用的爆发。

沈抖表示,传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统,对新的计算平台,也就是智能计算做好抽象和封装,重新定义人机交互,为开发者提供更简单、更流畅的开发体验。百度智能云万源,就是这样的新一代智能计算操作系统。

image.png

百度集团执行副总裁、百度智能云事业群总裁 沈抖

以下为演讲实录:

image.png

大家上午好!今天,我想用一句我非常喜欢的话来开场:“简单是终极的复杂”。

这句话来自苹果公司的第一本宣传册,也有人说它来自达芬奇。不论来自哪里,它代表着我们对极简之美的共同追求。

在百度,我们的使命就是“用科技让复杂的世界更简单”。回到今天的主题“人人都是开发者”,那我们追求的一种简单,就是让每个人都可以用极简的方式开发出极强的软件。

640.gif

80年前,第一代“程序员”手动插拔电缆、转动旋钮,用布线板来操作计算机,难度大、效率低还容易出错。

640 (1).gif

后来,汇编语言和汇编器出现了。我们可以用一种相对自然的方式告诉机器如何工作,大大提高了开发效率。这种让程序代替人工、让软件管理硬件的方式,就是操作系统的雏形。

但这还远远不够。

640 (2).gif

再后来,高级编程语言和编译器诞生了,计算平台进一步进化,开发者可以用更接近人类的方式表达需求,无需关心底层软硬件的复杂性。大多数的应用可以在不修改任何代码的情况下,都可以迁移到其它硬件上去运行。

640 (3).gif

9,000+行代码的UNIX6

640 (4).gif

4,300,000+行代码的WinNT

640 (5).gif

45,000,000+行代码的WinXP

软件越来越复杂,硬件越来越先进。随之升级的是快速迭代的操作系统。

本质上,操作系统就是管理硬件和软件,往下一层层屏蔽底层的复杂性、往上抽象成简单的交互界面。对开发者来说,只需要关注业务本身的逻辑,使用简单的编程工具和语言,开发相应的软件功能。

640 (6).gif

随着软件规模和复杂度的提高,单台机器已经不能满足需求,集群出现了。

集群出现以后,操作系统管理的对象,不再是单台机器和运行在上面的“进程”,而是整个集群和上面运行的各种“微服务”,管理的对象和复杂性有了质的变化。

640 (7).gif

云计算应运而生,集群管理的复杂性从此被隐去,开发者可以按需扩缩容,灵活响应市场的变化。

640 (8).gif

到了今天又不一样了,大模型出现了。机器和系统第一次不再是人类的提线木偶,而是具备了“理解、生成、逻辑和记忆”的能力。这将彻底改变人和机器的关系,这其中最重要的一点就是软件开发的范式。编程不再是少数经过专业训练的程序员的特权。相反,人人都是开发者。编程不再需要从C/C++学起,而是从自然语言开始;编程不再是面向过程、面向对象,而是面向需求,以后编程的过程,就是一个人表达愿望的过程。

这是革命性的变化。它会彻底颠覆原有的操作系统。

在操作系统的内核中,底层的硬件从以CPU算力为主变成以GPU算力为主,而且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。操作系统管理的对象,从管理进程到管理微服务,进而进化到了管理智能。

image.png

传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统,对新的计算平台,也就是智能计算做好抽象和封装,重新定义人机交互,为开发者提供更简单、更流畅的开发体验。那这种操作系统到底应该长什么样子呢?

640 (9).gif

它需要能管理万卡规模的集群,需要极致发挥GPU、CPU的性能,需要高速互联。

640 (10).gif

它需要有强大的大模型作为核心引擎,不仅是语言大模型,还有视觉大模型。

而这些就构成了操作系统的内核。

640 (11).gif

在内核层之上,还需要构建起强大的大模型服务能力,我们刚才提到内核层的各种模型,它们的精调、评估、部署、调用等工具链,我们都要建立起来。

640 (12).gif

而在这之上,我们还有好的应用开发工具去做工作流编排、插件管理,让应用开发像搭积木一样简单!

640 (13).gif

当然了,一个操作系统,作为企业服务,安全和运维也必不可少。

640 (14).gif

此外,它还要隐藏掉上一代云原生系统的复杂性。

而且最后,它要能够推动加速AI原生应用的爆发。

image.png

这就是新一代智能计算操作系统……万源!

鼓个掌!这个鼓掌很值得,为什么呢?

有一种说法叫软件定义世界,而今天我们呈现的万源就是用来帮助人类去定义软件。

image.png

接下来,我们打开万源,看看里面的每一个部分。

image.png

首先是内核层。大模型不是免费的午餐,强大的模型能力需要巨大的算力、甚至电力,算力的有效管理至关重要。实际上现在因为不合理的算力管理和使用方法,当下社会上很多算力被浪费掉了。我们需要一个强大的操作系统将现有的算力资源发挥到极致,支撑大模型和应用创新的迭代。

我们知道,要训练一个好的大模型,需要上万张卡的集群。但是,如果要让上万张卡像一张卡一样工作、实现性能的线性扩展、保障任务不间断,这对集群的设计、调度、容错都是巨大的挑战。

目前,在百舸,我们的万卡集群上的有效训练时长占比达到了98.8%;线性加速比和带宽有效性都超过了95%。这绝对是业界最高级别的算力效能。

image.png

在算力方面,国内还有一个特殊情况,就是芯片供应的不确定性,这必然会导致将来多款芯片并存的格局。短期看,这是大家被动接受的局面;但是长期看,这一定是大家主动选择的结果。因为只有这样,才能摆脱对单一芯片的依赖,实现更优的成本,保证更有弹性的供应链。

但是,不同厂商的芯片差异很大;即使同一厂商,不同代际的芯片差距也很大。用来推理还可以,但如果想训练大模型、尤其是在单一训练任务上,把不同芯片用好非常难。

今天,我很高兴地告诉大家,百舸平台上已经实现了百卡规模、单一训练任务下,不同厂商芯片的混合训练,而且把训练的性能损失控制在3%,即使在千卡规模下,性能损失也不超过5%。可见百舸已经给大家屏蔽掉了芯片之间的差异,给了大家选择不同芯片组合的权利!

这里真的应该有掌声,我们苦芯片久矣。芯片会变得越来越多元,我们需要这样的能力去帮助我们管理不同的芯片,把它们绑在一起像一款芯片一样工作。

image.png

当然了,内核中的另一个重要组成部分是大模型。它压缩了庞大的世界知识,将理解、生成、逻辑、记忆能力封装起来、向上提供简单的接口,让AI原生应用可以高效运行。

万源的内核,既包含了业界领先的ERNIE 4.0、3.5这些海峰刚刚讲过的模型、也包括ERNIE Speed/Lite/Tiny系列轻量模型,此外还包括文心视觉大模型和一些各有特色的第三方大模型,充分满足用户在不同业务场景下的多样化需求。

image.png

内核之上是千帆ModelBuilder。内核中的这些模型的管理、调度、二次开发,都可以通过ModelBuilder解决。很多场景化的需求,不需要从头去训练大模型,只要在合适的基础大模型上,做些模型精调、甚至就是改一下提示词,就可以很好地解决问题。

ModelBuilder的目的就是要把这些工具产品化,屏蔽掉模型开发的复杂性,让更多人只需要投入少量的数据、资源和精力,就能快速精调出适合自己业务的模型。

在实际应用中,就像Robin刚才提到的,我们需要合理地组合不同的模型。ModelBuilder提供的模型路由服务,会自动给不同难度的任务选择最合适的模型,实现效果和成本的最优组合,在效果基本持平的情况下,它可以使得推理成本降低30%以上。

image.png

再往上看,是工具层。千帆AppBuilder和AgentBuilder是强大的应用开发平台,正如Robin刚才已经演示了好几个这样的案例,它们可以支持各种agent和应用的快速开发和发布。通过AppBuilder开发的应用,可以一键发布到百度搜索、微信公众号等平台,也可以通过API或SDK的方式直接集成到您自己的系统中。真正做到极速开发,轻松上市。

image.png

当然了,现阶段,大模型还不够完美,有些场景下,人的经验可以帮agent做更好的任务规划,因此AppBuilder发布了工作流编排功能。基于AppBuilder的工作流编排,开发者可以使用预置的模板和组件,轻松定制自己的业务流程,还可以在上面集成、扩建自己特色的组件,在不同节点上选用不同的模型。如果您在ModelBuilder上精调了模型,那现在在AppBuilder上也可以很方便地直接调用,整个过程非常便捷。

image.png

所以现在大家可以看到,万源从内核到Shell、再到应用开发工具,已经实现了层与层的有机结合、端到端的效能优化。过去一年多,在内外部客户的各种实际应用中,不断打磨、持续完善,万源,已经成为AI原生时代的智能计算操作系统,为用户提供极简的开发体验、智能的系统内核,和高效的异构算力。

image.png

今天的发布是一个起点。未来,我们会进一步开放操作系统各个层面的生态合作。

image.png

向上,我们要开放更多的能力和接口,开发者可以非常简单地开发应用。

image.png

向左,我们可以用万源作为基础、帮助大家打造出适合自己垂直行业的操作系统。

image.png

向右,我们可以把万源直接部署在智算中心,享受稳定、安全、高效的智能计算平台。

image.png

向下,我们会适配更多的芯片,为开发者进一步隐去异构集群的复杂性,让不同的芯片都能发挥最大的效能。

image.png

除了底层硬件,我们也欢迎更多的合作伙伴一起,在模型、工具、应用等各个层面上持续丰富万源的生态。

image.png

这就是我今天要给大家分享的,全新一代智能计算操作系统——万源,强大、敏捷、开放,为在座诸位和每一个有想法的人提供极致简单的开发体验,让您的每一个创意都能在分钟之间上线、应用!

image.png

今天,人人都是开发者,人人都是创造者。

无需等待,即刻启程。

让智能,生成无限可能!谢谢大家!

——————END——————

推荐阅读

基于afx透明视频的视觉增强前端方案

百度一站式数据自助分析平台(TDA)建设

浅析如何加速商业业务实时化

登录系统演进、便捷登录设计与实现

一文带你完整了解Go语言IO基础库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1624623.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【树莓派】yolov5 Lite,目标检测,树莓派4B,推理v5lite-e_end2end.onnx,摄像头实时目标检测

文章目录 YOLOv5 Lite: 在树莓派上轻松运行目标检测1. 环境配置2. 克隆项目3. 安装依赖项4. 下载模型权重5. 理解end2end的含义6. 示例推理7. 文件介绍8. 把文件弄到树莓派4B执行9. 进一步尝试fp16的onnx(行不通)10. 视频流检测 这里有大概的环境配置&am…

太速科技-多路PCIe的阵列计算全国产化服务器

多路PCIe的阵列计算全国产化服务器 多路PCIe的阵列计算全国产化服务器以国产化处理器(海光、飞腾ARM、算能RSIC V)为主板,扩展6-8路PCIe3.0X4计算卡; 计算卡为全国产化的AI处理卡(瑞星微ARM,算能AI&#x…

【预测】小米汽车电子电气架构的猜想

文章目录 前言 整车EEA 硬件平台 软件平台 总结 参考资料 前言 见《【Review】小米汽车发布会》 整车EEA 小米汽车整车电子电气架构方面的信息,小米官方并没有对外介绍,但是从近日流出的整车BOM和供应商列表中看到,车上各种控制器一个都…

四川易点慧电子商务:抖音小店引领潮流,先进模式打造电商新标杆

在当下数字化浪潮中,电子商务行业如日中天,四川易点慧电子商务有限公司以其独特的视角和前瞻性的战略布局,成功在抖音小店领域崭露头角,成为行业内的佼佼者。本文将深入剖析四川易点慧电子商务的成功秘诀,以及其在抖音…

基于OpenCV的人脸签到系统

效果图 目录文件 camerathread.h 功能实现全写在.h里了 class CameraThread : public QThread {Q_OBJECT public:CameraThread(){//打开序号为0的摄像头m_cap.open(0);if (!m_cap.isOpened()) {qDebug() << "Error: Cannot open camera";}//判断是否有文件,人脸…

OmniPlan Pro for Mac v4.8.0中文激活版 项目流程管理工具

OmniPlan Pro for Mac是一款功能强大的项目管理软件&#xff0c;它以其直观的用户界面和丰富的功能&#xff0c;帮助用户轻松管理各种复杂的项目。 OmniPlan Pro for Mac v4.8.0中文激活版 通过OmniPlan Pro&#xff0c;用户可以轻松创建任务&#xff0c;设置任务的开始和结束时…

【ensp实验】Telnet 协议

目录 Telnet 协议 telnet协议特点 Telnet实验 ​编辑 不使用console口 三种认证模式的区别 Telnet 协议 Telnet 协议是 TCP/IP 协议族中的一员&#xff0c;是 Internet 远程登录服务的标准协议和主要方式。它为用户提供了在本地计算机上完成远程主机工作的能力。在终端使用…

软考-论文写作-论架构风格论文

题目 素材 框架 一、 摘要 2020年12月,我参加了某省政协委员履职系统的开发。该系统为政协机关人员线上开展各项工作以及委员完成各项履职提供了全方位的软件支撑。我在该项目重担任系统架构师一职,负责履职系统的架构设计。本文结合实践,以委员履职系统为例,主要讨论软件…

访问控制列表配置实验

ACL&#xff0c;全称 Access Control List&#xff08;访问控制列表&#xff09;&#xff0c;是一种实现访问控制的机制&#xff0c;用于规定哪些主体&#xff08;如用户、设备、IP地址、进程等&#xff09;可以对哪些资源&#xff08;如网络服务、文件、系统对象等&#xff09…

多组学+机器学习+膀胱癌+分型+建模

这是一个基于多组学机器学习的分型建模文章&#xff0c;这里我们大概介绍一下&#xff0c;这篇文章做了啥 一、研究背景 1、尿路上皮癌是高度恶性的肿瘤&#xff0c;预后差&#xff0c;死亡率高 2、没有明显有效的治疗方法&#xff0c;多数患者在免疫治疗中无法受益&#xf…

STM32H750外设ADC之开始和结束数据转换功能

目录 概述 1 开始转换 1.1 使能ADSTART 1.2 使能JADSTART 1.3 ADSTART 通过硬件清零 2 转换时序 3 停止正在进行的转换&#xff08; ADSTP、 JADSTP&#xff09; 3.1 停止转换功能实现 3.2 停止转换流程图 概述 本文主要讲述了STM32H750外设ADC之开始和结束数据转换…

JavaScript-Vue入门

本文主要测分享Vue的一些基础 Vue简介 Vue.js 是一个构建数据驱动的 web 界面的渐进式框架。它的主要目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。 下是一些 Vue 的主要特点和概念&#xff1a; 1. 响应式数据绑定&#xff1a;Vue 使用基于 HTML 的模板语法…

Android --- SharedPreferences

SharedPreferences 对应sp文件的接口 使用 SharedPreferences API可以保存的相对较小键值对集合。SharedPreferences 对象指向包含键值对的文件&#xff0c;并提供读写这些键值对的简单方法。每个 SharedPreferences 文件均由框架进行管理&#xff0c;可以是私有文件&#xff…

李沐66_使用注意力机制的seq2seq——自学笔记

加入注意力 1.编码器对每次词的输出作为key和value 2.解码器RNN对上一个词的输出是query 3.注意力的输出和下一个词的词嵌入合并进入RNN 一个带有Bahdanau注意力的循环神经网络编码器-解码器模型 总结 1.seq2seq通过隐状态在编码器和解码器中传递信息 2.注意力机制可以根…

stable diffusion 的controlNet 安装和使用

stable diffusion 安装controlNet需要先下载扩展 扩展地址 下载了扩展以后&#xff0c;需要下载相应的模型&#xff0c;每个模型大约1.45G,可以按需下载。 模型地址 如果下载速度太慢&#xff0c;可以考虑去liblib下载&#xff0c;但是是全量模型 liblib 模型下载完后&#…

使用windows端MySQL创建数据库

1.命令行登录数据库 命令&#xff1a;mysql -u用户名 -p密码&#xff1b; 切记命令后面要以分号结尾 2. 查看和创建数据库 查看数据库命令&#xff1a;show database&#xff1b; 创建数据库命令&#xff1a;mysql> create database db_classes; 创建一个名为db_classes的…

通配符HTTPS安全证书

众多类型的SSL证书&#xff0c;要说适用或者说省钱肯定是通配符了&#xff0c;因为谁都想一本SSL证书包括了整条域名&#xff0c;而且也不用一条一条单独管理。 通配符HTTPS安全证书&#xff0c;其实就是通配符SSL证书&#xff0c;SSL证书主流CA的参数都一样&#xff0c;通配符…

使用riscv-tests进行指令测试(二)

使用riscv-tests进行指令测试&#xff08;二&#xff09; 1 测试用例命名规则2 测试用例dump文件介绍 本文属于《 TinyEMU模拟器基础系列教程》之一&#xff0c;欢迎查看其它文章。 1 测试用例命名规则 用例名称 TVM Name “-” Target Environment Name “-” “指令”…

【论文浅尝】Phi-3-mini:A Highly Capable Language Model Locally on Your Phone

Phi-3-mini phi-3-mini&#xff0c;一个3.8亿个参数的语言模型&#xff0c;训练了3.3万亿个token&#xff0c;其总体性能&#xff0c;通过学术基准和内部测试进行衡量&#xff0c;可以与Mixtral 8x7B和GPT-3.5等模型相媲美(在MMLU上达到69%&#xff0c;在MT-bench上达到8.38)&…

python_django农产品物流信息服务系统6m344

Python 中存在众多的 Web 开发框架&#xff1a;Flask、Django、Tornado、Webpy、Web2py、Bottle、Pyramid、Zope2 等。近几年较为流行的&#xff0c;大概也就是 Flask 和 Django 了 Flask 是一个轻量级的 Web 框架&#xff0c;使用 Python 语言编写&#xff0c;较其他同类型框…