百度智能云千帆,产业创新新引擎

news2024/9/20 18:34:21

image.png
本文整理自 3 月 21 日百度副总裁谢广军的主题演讲《百度智能云千帆,产业创新新引擎》。


各位领导、来宾、媒体朋友们,大家上午好。很高兴今天在石景山首钢园,和大家一起沟通和探讨大模型的发展趋势,以及百度最近一段时间的思考和实践。

自去年 3 月 27 日发布千帆大模型平台到今天,刚好过去了一年的时间。过去这一年,国内外的大模型都在迅速发展,相关应用的爆发趋势也更加明显。

从发展趋势来看,有如下几个特点:

  • 第一, 大模型的技术在不断进步。通过模型架构改进、训练算法调优等方式,大模型的效率和性能都得到了显著提升;

  • 第二,行业应用场景的成熟。大模型在各种行业已经开始落地,这些实践经验激发了行业更多的兴趣和投入;

  • 第三,政府、投资机构对人工智能技术的支持不断增加。这也为大模型的研发、部署和应用提供了更多资源和机会;

  • 第四,社会对人工智能技术的理解和接受度不断提高。用户对于智能化、个性化服务的需求, 也推动了大模型在各种场景中的应用。

但在过去一年与企业的实际接触过程中,我们发现企业落地大模型时,也面临着在落地场景的探索、应用开发的门槛、推理和训练的成本和落地应用的效果等四个方面的挑战。

image.png

为了解决这些挑战,帮助企业用户落地,千帆提供了包括算力、模型开发、应用开发在内的一整套的大模型开发工具,为企业打造了大模型服务的超级工厂,帮助企业降低成本、提高效率与模型应用的效果。

image.png

千帆平台自发布以来一直保持着高速增长的趋势,相比于去年 12 月,千帆的日均季度环比增长了 97%,翻了接近一倍。

image.png

同时,我们也很高兴地跟大家宣布,千帆平台服务客户数已经突破了 8 万,最近一个月就增长了近 1 万。

同时,平台已经精调出 1.3w 个模型,开发应用数也达到了 16w。基于这些数据大家也可以看到,大模型已经真正进入到了快速增长的阶段。

未来,千帆也将帮助企业客户、开发者看到更多「创新机会」。随着千帆客户数量不断增多,我们也感受到,大家目前更关心的是怎么把大模型「用起来」,真正给企业业务带来价值。

image.png

今天,我为大家带来全新升级的 AI 原生应用开发平台 AppBuilder,以最好的应用效果、最优的开发体验支撑 AI 原生应用的繁荣。

image.png

千帆 AppBuilder,是一个产业级的 AI 原生应用开发平台。它可以帮助广大的客户和开发者不断降低应用开发门槛。

AppBuilder 底层由基础组件和高级组件构成。在基础组件中,包含大模型组件、AI 能力组件等。这些组件都是基于百度多年的技术和实践经验沉淀的。

除了基础组件,AppBuilder 还面向典型的应用场景,深入调优建设了一系列高级组件,比如知识问答类的 RAG、具备运算能力的代码解释器,以及生成式数据分析 GBI 等。

基础组件和高级组件共同支撑 Agent。一方面可以通过工作流编排实现更为复杂的业务逻辑,另一方面 Agent 也具备强大的自主任务规划能力。所有这些底层能力,通过代码态和零代码态两种形态提供服务。同时,多渠道对外集成分发。

image.png

千帆 AppBuilder 具备三大核心优势特点:

  • 第一,应用效果领先,具备高精度知识问答效果及精准的自主任务规划能力;

  • 第二,组件多元化且支持自定义接入;

  • 第三,产品开放易用。

接下来我来为大家详细介绍。

image.png

讲应用效果就离不开场景。知识问答(也就是 RAG )是大模型最典型的应用场景之一。AppBuilder 在这个场景建设了企业级全链路检索增强的应用框架及周边工具,并做了很多深入细致的优化工作,包括底层基座模型的 SFT 调优、文档解析、语义匹配、问题拆解等环节的策略优化,使得知识问答的效果达到更好的水平。

通过这些优化,AppBuilder 的 RAG 在多场景问答准确率、友好回复、准确拒答等方面可接受度达 95% 以上。大家可以看到下图中的对比数据, AppBuilder 在效果上超越了其他同类产品。

image.png

另一个非常典型的应用场景是 Agent。AppBuilder 构建了具备精准自主任务规划能力的 Agent 框架,可实现多工具自动编排, 准确率达到 90% 以上。官方提供了近 30 种编排工具,覆盖电商/互娱/办公/专业服务等主流场景。

同时,AppBuilder 支持开发者接入自定义工具, 通过自动编排与手动编排的结合,实现复杂场景需求的定制。此外,代码解释器的效率与效果持续提升,相比 升级前性能提升 40%、数据分析场景可接受度提升到 95%。

image.png

AppBuilder 具备丰富的组件工具,目前已扩充到 55 个。这些组件包括基于百度技术积累和自有业务沉淀的大模型能力组件,如多轮改写、复杂 Query 分解等;也包括 AI 能力组件,比如 TTS、OCR、图像识别等。通过大小模型联合及业务场景化工具组件,共同支撑 AI 原生应用的开发。

此外,AppBuilder 还提供了百度独家开放的业务组件,如在搜索领域有深厚积累的百度搜索,以及一些业界主流场景的第三方 API,比如航班查询、论文查询等。

同时,AppBuilder 支持用户接入自定义组件。我们还提供百度基础云的一些组件,比如 BES 等,这里特别提下专用向量数据库 VDB,它也迎来了一次全新的升级。

image.png

向量数据库是企业不可或缺的知识库核心组件,它针对传统知识库问答系统所遇到的性能瓶颈、 维护挑战及规模限制等问题提供了有力解决方案。

VDB 1.0 这一革命性的数据库内核,不仅集成了全面的运维控制和安全防护能力,还兼容了千帆、LangChain 等主流生态系统,使企业能够轻松管理数以千万计的文档知识。

在性能表现上,VDB 与同类型开源产品相比,其在不同应用场景下的性能有不同程度的提升,最高可达 10 倍,真正实现了毫秒级的向量检索速度。

同时,在扩展性方面,支持最大百亿级别的向量数据存储,以及秒级的弹性伸缩响应。这些突出优势确保了 VDB 能够伴随企业业务的不断发展而升级,持续满足日益增长的业务需求。

image.png

再回到 AppBuilder。它的第三大优势是开放易用。

  • 首先是主流场景的工具组件开放可灵活编排, 提供丰富的应用示例,用户一次鉴权全部接入。

  • 其次, 提供开源的 RAG 和 Agent SDK ,支持二次开发。本次升级后,最快只需要三步即可完成应用的创建于开发,还可一键对接百度灵境矩阵、微信公众号、微信客服、Web 端/ H5 等渠道。

这里也特别说一下百度灵境矩阵,此次与灵境矩阵的打通,应用将有机会在百度强大的搜索场景中轻松实现分发和挂载,同时也能融入百度的信息流场景,吸引更多潜在用户的目光。

image.png

目前,已经有上万开发者和伙伴,通过 Appbuilder 创建出各种场景的 AI 原生应用。

刚刚我分享的是如何帮助企业快速去搭建应用。除了降低企业的应用开发门槛,企业还会有另外一个需求,就是开发出的应用效果怎么能够做好。这背后是通过我们的各种基座模型的能力去实现的。

image.png

今天,在千帆大模型平台上的模型迎来了关键升级和全新模型发布,首先让我们来一起看下文心大模型 3.5 和 4.0 的重磅升级。

image.png

首先,我来为大家介绍文心大模型 ERNIE 3.5 的重磅升级。

升级后的 ERNIE 3.5,在指令遵循、上下文学习和逻辑推理能力都有显著的效果提升, 同时我们可以看到企业核心的文案创作、信息抽取、工具调用场景都有不同程度的效果优化。

除了普遍应用的 ERNIE 3.5,另一个受到行业广泛关注的是大模型 ERNIE 4.0。它在理解、生成、逻辑、记忆能力等方面均达到业界顶尖水平。

经权威机构测评,ERNIE 4.0 在专项学科能力、安全与责任、以及综合得分均排名第一。作为目前行业领先、以及中文领域最强模型,ERNIE 4.0 已经成为企业在复杂场景应用的最佳选择。

image.png

以上就是我们文心大模型 3.5 和 4.0 的升级内容。

随着接触客户及场景越来越多,我们发现一个趋势:很多的公司在使用大模型的时候,成本是他们考虑的关键因素。我们总结了一下这类需求,归纳为【效价比】

结合百度持续的技术升级及领域深耕,我们发现,在特定场景下,参数较小的大模型经过精调可以达到甚至超越大模型的效果,而且能为企业大幅降低成本及响应速度。

image.png

今天,我们将为大家带来三款轻量级大模型的发布,便于企业通过推理、精调的方式去实现最优效价比。

image.png

首先是全新发布 ERNIE Speed,这是一个最适合微调的基座模型,同时上下文最高支持 128K。

大家可以看到右边的这组数据对比:以小说角色扮演和英语口语练习的场景为例,可以明显看到微调后的 ERNIE Speed 效果超越了大参数量级模型 ERNIE 4.0。

image.png

如果企业还要追求更快、更轻、成本更低, 第二款产品 ERNIE Lite 将是企业的首选,同时 Lite 也是一款非常适合低算力、AI 加速卡推理使用的轻量级大模型。

ERNIE Lite 是 ERNIE-Bot-turbo 模型的升级版。我们可以看到新版的 Lite,相较于 Turbo 在情感分析、多任务学习、自然推理等场景下效果提升了 20% 左右。

除了效果上的提升,企业在该模型上的推理调用成本,对比升级前降低了 53%。

image.png

最后一款模式可以说是极致低成本、低延迟的最佳模型:ERNIE Tiny。

Tiny 是目前文心系列中部署与精调成本最低的模型,非常适用于检索、推荐、意图识别等高并发、低延时的场景。

举个例子,在搜索推荐场景下,精调后的 Tiny 在推荐词激发环节,相较于之前使用 ERNIE 3.5 模型,对话轮次增长了 3.5%,成本下降了 32%。

image.png

除了文心大模型升级以及轻量级大模型的发布外,我们此次还基于垂直场景, 推出了两个产业级最佳实践模型:ERNIE Character 和 ERNIE Functions。

ERNIE-Character 是专为角色扮演类场景研发的一款大模型,非常适合游戏 NPC、客服对话等业务应用。

举一个实际的应用案例,目前我们的某个智能硬件厂商客户,通过 Character 模型打造智能助理,在人设一致性,以及激发用户聊天欲望等方面,给业务带来了显著提升。

另外,ERNIE Functions 作为一款工具调用场景大模型,优点是结构化回答及合成能力强,并且输出格式稳定。我们某个旅游出行客户,通过 ERNIE Functions 打造了智能客服助手,在执行订票、查询航班状态等多种场景下,调用的准确率达到了 92% 以上。

image.png

今天,我已经发布完 5 款全新的模型,那么在企业具体应用中,这些模型是如何为企业带来最优效价比的?我来通过一个模型路由的案例,为大家具体说明一下。

模型路由,来源于现在比较流行的 MoE。它的核心理念就是通过轻量级大模型降本增效。

大家可以看到左边,在用户输入问题之后,就接入到 router 模型中。router 模型负责判别用户的意图,在把用户的意图分发到不同的大模型中。

以前整个场景都在用大参数模型。现在,我们就可能基于这种意图判别把很多的垂类场景请求分发到更小尺寸的模型中。在企业的实际应用过程当中,模型路由是一个非常划算的方式。

以手机智能助手为例,通过该模式,用户推理成本可以降低 15%,同时效果和 ERNIE 3.5 持平。未来我们也会把这套方案做成产品,让用户通过精调的方式自主选择分流的方案。

image.png

最后,我们再用一张图,来回顾和梳理下百度智能云千帆大模型平台的模型矩阵。

文心大模型 3.5 和 4.0 适合通用复杂场景。轻量级大模型中,ERNIE Speed 和 ERNIE Lite 适用于垂直场景的定制训练。ERNIE Tiny 更快、更实惠,可用于特定场景的自然语言到指令调用,也适用边缘设备推理场景。

垂直场景模型 ERNIE Character 适合角色扮演,ERNIE Functions 适合对话或问答场景中的外部工具使用和业务函数调用。

模型效果能力越强的模型,成本也会更高。 轻量级的大模型在特定场景,经过精调也会达到大参数模型的效果。企业可以在实际应用中,根据业务的需求来灵活选择不同的模型或者模型组合。

image.png

以上就是我今天发布的全部内容。

助力产业创新,千帆竞航未来  希望千帆能够助力企业和开发者在大模型的浪潮里,竞发向前,共赢未来。感谢大家!

image.png

- - - - - - - - - - END - - - - - - - - - -

推荐阅读

一文带你完整了解Go语言IO基础库

百度交易中台之系统对账篇

揭秘百度数仓融合计算引擎

教不会你算我输系列 | 手把手教你HarmonyOS应用开发

漫谈数据分布可视化分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1553331.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

快速上手Spring Cloud 七:事件驱动架构与Spring Cloud

快速上手Spring Cloud 一:Spring Cloud 简介 快速上手Spring Cloud 二:核心组件解析 快速上手Spring Cloud 三:API网关深入探索与实战应用 快速上手Spring Cloud 四:微服务治理与安全 快速上手Spring Cloud 五:Spring …

Prometheus +Grafana +node_exporter可视化监控Linux + windows虚机

1、介绍 待补充 2、架构图 Prometheus :主要是负责存储、抓取、聚合、查询方面。 node_exporter :主要是负责采集物理机、中间件的信息。 3、搭建过程 配置要求:1台主服务器 n台从服务器 (被监控的linux或windows虚机&am…

【APP_TYC】数据采集案例天眼APP查_查壳脱壳反编译_③

是不是生活太艰难 还是活色生香 我们都遍体鳞伤 也慢慢坏了心肠 你得到你想要的吗 换来的是铁石心肠 可曾还有什么人 再让你幻想 🎵 朴树《清白之年》 查壳 工具介绍Frida-dexDump Frida-dexDump简介 Frida-dexDump是基于Frida的一个工具&…

python(一)网络爬取

在爬取网页信息时,需要注意网页爬虫规范文件robots.txt eg:csdn的爬虫规范文件 csdn.net/robots.txt User-agent: 下面的Disallow规则适用于所有爬虫(即所有用户代理)。星号*是一个通配符,表示“所有”。 Disallow&…

SpringMVC设置全局异常处理器

文章目录 背景分析使用ControllerAdvice(RestControllerAdvice)ExceptionHandler实现全局异常全局异常处理-多个处理器匹配顺序存在一个类中存在不同的类中 对于过滤器和拦截器中的异常,有两种思路可以考虑 背景 在项目中我们有需求做一个全…

element-ui autocomplete 组件源码分享

紧接着 input 组件的源码,分享带输入建议的 autocomplete 组件,在 element-ui 官方文档上,没有这个组件的 api 目录,它的 api 是和 input 组件的 api 在一起的,看完源码之后发现,源码当中 autocomplete 组件…

农村分散式生活污水分质处理及循环利用技术指南

标准已完成意见征集: 本文件给出了农村分散式生活污水分质处理及循环利用的总则、污水收集、污水分质处理、资源化利用、利用模式、运维管理等的指导。 本文件适用于农村分散式生活污水分质处理及循环利用的设施新建、扩建和改建工程的设计、施工与运维。 注:本文件…

Linux基础篇:解析Linux命令执行的基本原理

Linux 命令是一组可在 Linux 操作系统中使用的指令,用于执行特定的任务,例如管理文件和目录、安装和配置软件、网络管理等。这些命令通常在终端或控制台中输入,并以文本形式显示输出结果。 Linux 命令通常以一个或多个单词的简短缩写或单词…

嵌入式学习44-哈希算法和排序算法

Hash 哈希算法: 在记录的 存储位置 和它的 关键字 之间建立一种去特定的对应关系,使得每个关键字key对应一个存储位置; 查找时,根据确定的对应关系,找到给定的 key 的映射。 记录的存储位置 f&a…

振弦采集仪在预防地质灾害监测中的作用与应用前景

振弦采集仪在预防地质灾害监测中的作用与应用前景 振弦采集仪(String Vibrating Sensor,简称SVM)是一种用于地质灾害监测的重要仪器,它通过测量地面振动信号来预测和预警地质灾害的发生。SVM的作用在于提供实时、准确的地质灾害监…

【C++课程设计】校园导游程序及通信线路设计

私信我获得论文 问题描述: 设计校园平面图,所含景点不少于10个。以图中顶点表示校内各景点,存放景点名称、代号、简介等信息;以边表示路径,存放路径长度等相关信息。 (1) 显示校园平面图(用cout显示即可&a…

C#实现身份证格式验证(自建异常实现提醒)

基本信息 中国居民身份证的格式包括18位数字,这些数字分别代表不同的信息: 第1、2位数字表示省份代码。 第3、4位数字表示城市代码。 第5、6位数字表示区县代码。 第7至14位数字表示出生年、月、日(其中7、8、9、10位是年,11、12…

理发店在线预约小程序源码系统 带完整的安装代码包以及搭建教程

理发店作为人们日常生活中经常光顾的场所,其服务质量和预约便利性直接影响到顾客的满意度。传统的理发店预约方式往往存在效率低下、信息不透明等问题,无法满足现代消费者的需求。因此,开发一款理发店在线预约小程序源码系统,对于…

Zabbix6 - Centos7源码编译部署HA高可用集群手册

Zabbix6 - Centos7源码编译部署HA高可用集群手册 HA高可用集群 总所周知,在我们IT运维的圈圈中,HA高可用集群服务算是逼格最高的吧也是运维里保障力度最大的环境。 HA是HighlyAvailable缩写,是双机集群系统简称,提高可用性集群,是保证业务连续性的有效解决方案,一般有两个…

数据运营分析-详解

一、指标与指标体系 指标体系就是业务逻辑的框架,也是思考业务逻辑的第一步 案例: 老板,我负责的用户活跃,主要考察每天启动产品的注册用户数量,整体来看,每月活跃保持7.3%的增长,是因为渠道团队的拉新活动带来很多新增注册用户,占每月活跃用户的40%,新一年会继续沿…

苹果应用商店上架工具比较分析与推荐

摘要 移动应用app上架是开发者关注的重要环节,但常常会面临审核不通过等问题。为帮助开发者顺利完成上架工作,各种辅助工具应运而生。本文探讨移动应用app上架原理、常见辅助工具功能及其作用,最终指出合理使用工具的重要性。 引言 移动应…

CSS实现小车旅行动画实现

小车旅行动画实现 效果展示 CSS 知识点 灵活使用 background 属性下的 repeating-linear-gradient 实现路面效果灵活运用 animation 属性与 transform 实现小车和其他元素的动画效果 动画场景分析 从效果图可以看出需要实现此动画的话,需要position属性控制元素…

梵宁教育助力大学生技能学习全面探索

在数字化时代,设计、剪辑与手绘等技能已成为大学生必备的能力之一。梵宁教育,以其深厚的教育底蕴和前瞻的教育理念,为广大学子提供了一个全面学习这些技能的优质平台。本文将深入探讨梵宁教育如何助力大学生在设计、剪辑与手绘技能上的学习与…

数据中心末端配电监控产品--AMB智能母线监控/始端箱插接箱母线测温/电力智能母线/智能母线测温/母线槽测温

列头柜对比母线槽 安科瑞薛瑶瑶18701709087 ◉铺设难度大,工期长◉聚集温升,火灾隐患◉检修困难◉灵活性差 ◉列头柜占用机柜位 列头柜电缆--智能母线系统 ◉安装方便,工期短◉柜顶明装,方便检修◉散热快,温升低&…

Uibot6.0 (RPA财务机器人师资培训第5天 ) 报销汇总机器人案例实战

训练网站:泓江科技 (lessonplan.cn)https://laiye.lessonplan.cn/list/ec0f5080-e1de-11ee-a1d8-3f479df4d981https://laiye.lessonplan.cn/list/ec0f5080-e1de-11ee-a1d8-3f479df4d981https://laiye.lessonplan.cn/list/ec0f5080-e1de-11ee-a1d8-3f479df4d981https…