钛媒体首发 | 百度沈抖回应大模型价格战:希望大家别再天天拉表格比价格

news2024/11/15 22:58:10

ITValue

e55a80a1f00b585a4ba2c270fa234827.jpeg

“有这个时间,不如去卷场景、卷应用。”

作者|张帅

编辑|盖虹达

首发|钛媒体APP

  ITValue

钛媒体App 5月28日消息,在2024智能经济论坛上,百度集团执行副总裁、百度智能云事业群总裁沈抖介绍了文心系列主力大模型免费背后的原因。此外,为了加速行业大模型的落地,百度智能云推出“千帆·行业增强版”,目前已经在政务、交通、工业等行业落地。

“其实我们决定免费的原因特别朴素,就是希望大家别再天天拉表格比价格了,有这个时间,不如去卷场景、卷应用。现在成本更低了,大家创新的胆子可以更大一些、步子可以更快一些,把相关的场景都试一遍,快速验证。跑成功了,就快速复制。”沈抖表示。

此前大模型行业先后开启降价和免费热潮,字节、阿里、百度、腾讯、科大讯飞在内的多家厂商宣布降价或免费,将大模型竞争卷入新的阶段。

但就目前而言,价格并不是用户是否采用大模型的决定性因素,大模型产业链还不完备,降价更大程度起到吸引新客户的作用,是否能够留存客户,还要看大模型厂商的技术整合和生态能力。

一周前,百度智能云宣布ERNIE Speed、ERNIE Lite两款主力模型全面免费。这两个模型是客户在场景应用中经常用到的主力模型,在文案创作、聊天对话、知识问答、内容续写等场景中有较高的调用量。

0309589af8dbea9021015a71b27c24a2.jpeg

沈抖表示,模型免费以及降价,主要是依托于技术能力,尤其是AI异构算力管理平台和“一云多芯”

在AI异构算力管理平台方面,百度百舸·AI异构计算平台能够对不同地点、规模、集群的智能算力进行统一、高效的管理,基于芯片性能优化、自动芯片选型、潮汐混部等技术,大幅提升智能算力效能,万卡集群上的模型有效训练时长占比超过98.8%。相同的大模型任务,百舸能够帮助客户将资源成本降低一半。据推算,百舸每年为企业客户节约的智算成本可达50亿元以上。

在“一云多芯”方面,百舸兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持同一智算集群中混合使用不同厂商芯片,最大程度上屏蔽硬件之间差异,帮助企业摆脱单一芯片依赖,打造更有性价比、更安全、更具弹性的供应链体系。在多芯混合训练任务中,百舸能够将单芯片利用率、芯片间通信效率、集群整体效能发挥到极致,百卡规模性能损失不超过3%,千卡规模性能损失不超过5%,均为国内最高水平。

“大家非常关注自主可控。在芯片层,我们有自研的芯片昆仑芯,正在逐步推向市场;当然,如果有其它厂商的芯片,百舸计算平台也能很好地管理起来。在框架层,我们有自研的深度学习框架飞桨,已经成为国内最受欢迎的开源框架。在模型层,我们会保障模型的内容安全可控。”沈抖提到。

此外,在模型层面,千帆ModelBuilder提供的模型路由能力,能够针对任务类型自动分配合适的模型进行处理,让更便宜的小参数模型在特定场景中媲美大参数模型的效果。以小度AI助手为例,通过使用模型路由能力,相比全部任务调用旗舰版文心大模型,成本大幅下降了99%,模型响应速度也提升了200%。“即使是在复杂应用场景下,模型路由也可以节省30%的成本。”沈抖说。

de65631b9585b23fa143457fa6564479.jpeg

此外,为了进一步降低行业大模型的开发门槛,百度智能云此次推出了千帆·行业增强版。

沈抖指出,行业大模型本质上是一个多模型的行业解决方案,由一个通用大模型和多个行业模型组合而成。这些行业模型往往由小模型精调而成,在特定领域具有很强的能力。但企业应用场景十分复杂,如果只是用一个个“孤立”的行业模型去解决特定场景的问题,那么整套工程将会非常复杂,和传统的AI开发没有区别,开发效率极低。

具体来看,千帆·行业增强版主要由资源服务、大模型服务、应用服务三部分组成,它不仅提供千帆、百舸的通用能力,在这个基础上,还做了行业能力的扩展和适配。

在资源服务方面,企业可以结合业务情况,扩展多源数据治理、云边端协同等能力,为业务构建起强大的基础设施;在大模型服务方面,企业可以在千帆平台上自由选择不同参数规模、不同上下文长度、不同细分领域的大模型,然后按需扩展行业模型、行业知识、行业智能体;在应用服务方面,支持添加运营、运维、企业环境内应用开发、应用服务等各类业务逻辑。

沈抖表示,目前,百度文心大模型已经拥有中国最大的产业落地规模,超过半数的央企正在使用百度智能云。


*温馨提示:喜欢ITValue公众号的小伙伴注意啦!根据公众号推送新规,请将ITValue设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”

我知道你在看哦

fba44e8e588c78dcc44b7a9dcad42385.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1713034.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

视频监控业务平台LntonCVS运用国标协议对接视频汇聚管理综合平台应用方案

为了实现“以信息化推动应急管理能力现代化”的目标,应急管理部提出了加速现代信息技术与应急管理业务深度融合的计划。这一计划是国家加强和改进应急管理工作的关键举措,也是满足日益严峻的应急管理形势和人民群众不断增长的公共安全需求的紧迫需求。 为…

qq音乐sign逆向

qq音乐sign参数逆向 1.概览 参数sign长度40 多次调试发现,前缀zzb不变 2.打日志 跟站发现是vpm,在apply调用打上日志断点: 连蒙带猜知道,最终字符串四部分构成,zzb 24DC2798 HI0TvE4tOMqzN4w88oZCjQ EE0A88FE 1.把…

云平台教程 | 手把手教你GSEA富集分析和解读

爱基百客云平台小工具使用 1.1 爱基百客云平台之GSEA分析 1.2 GSEA富集分析原理图 1.3 GSEA富集分析过程 1.4 参数设置 1.5 任务查看 1.6 结果 1.6.1 富集结果表格 1.6.2 富集可视化图解读 01 爱基百客云平台小工具使用 首先,打开爱基百客官网:http://w…

Linux系统下安装配置nginx,本地访问服务器nginx

一、先安装依赖包 yum install -y gcc-c pcre pcre-devel zlib zlib-devel openssl openssl-devel 二、官网下载Nginx压缩包 官网地址:nginx: download 三、安装Nginx 1.这里我们下载稳定版本即可,在命令行输入以下命令,会在当前目录下生成…

智源与HuggingFace联合推出开放中文大语言模型榜单 - 旗鉴榜

近日,智源研究院与 Hugging Face 开发者社区合作,发布 Open Chinese LLM Leaderboard,旨在跟踪、排名和评估开放式中文大语言模型,通过开源社区共建、用户自主贡献的方式,持续推动和完善中文语言大模型的科学、客观排名…

TPM是如何平衡设备维护与生产需求的?

在当今快节奏的生产环境中,设备维护与生产需求之间的平衡成为了企业持续发展的关键所在。TPM(全面生产维护)作为一种先进的生产管理理念,为企业提供了实现这一平衡的有效路径。具体如深圳天行健精益管理咨询公司下文所述&#xff…

记录使用自定义编辑器做试题识别功能

习惯了将解析写在代码注释,这里就直接上代码啦,里面用到的bxm-ui3组件库是博主基于element-Plus做的,可以通过npm i bxm-ui3自行安装使用 // 识别方法: // dom 当前识别数据所在区域, questionType 当前点击编辑选择的题目类型&a…

docker的介绍、原理及操作

一、docker介绍 1.容器技术介绍 Container 即容器,平时生活中指的是可以装下其它物品的工具, 以方便人类归纳放置物品 、存储和异 地运输 ,比如人类使用的衣柜 、行李箱、 背包等可以成为容器,Container 除了容器以外&#xff…

Simulink从0搭建模型06-P7模型中结构体的使用

Simulink从0搭建模型06-P7模型中结构体的使用 本节课学习内容1. 结构体的创建 Bus Creator(多输入单输出)2. 结构体的引用 Bus Selector(单输入多输出)3. 结构体的赋值 Bus Assignment4. 结构体对象的创建 Bus object5. 结构体数组…

vue3 vant4实现抖音短视频功能

文章目录 1. 实现效果2. 精简版核心代码3. 完整功能点&#xff08;本文章不写&#xff0c;只写核心代码&#xff09; 1. 实现效果 2. 精简版核心代码 使用的 vue3 vant4组件使用van-swipe进行轮播图切换实现 <template><div :style"{width: width px,overflo…

Spark中的累加器与广播变量及blockmanager图解

一、累加器 1、累加器的引入 案例&#xff1a;没读取一条文件中的数据&#xff0c;count1&#xff0c;并打印在Drive端&#xff08;控制台&#xff09; import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.rdd.RDDobject Demo20Accumulator {def ma…

做电商,错过了2020年的抖音!那2024一定要选择视频号小店!

哈喽~我是电商月月 电商老板们集合了&#xff0c;问大家一个问题: 如果能让你回到三四年前&#xff0c;抖音才步入大众视野&#xff0c;这时候让你去做抖音小店&#xff0c;你愿意吗&#xff1f; 我敢相信&#xff01;很多&#xff0c;错过当年抖音红利的商家&#xff0c;一…

【每日力扣】300. 最长递增子序列 与 139. 单词拆分

&#x1f525; 个人主页: 黑洞晓威 &#x1f600;你不必等到非常厉害&#xff0c;才敢开始&#xff0c;你需要开始&#xff0c;才会变的非常厉害 300. 最长递增子序列 给你一个整数数组 nums &#xff0c;找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列&…

【计算机网络】P1 计算机网络概念、组成、功能、分类、标准化工作以及性能评估指标

目录 1 什么是计算机网络2 计算机网络的组成2.1 组成部分上2.2 工作方式上2.3 功能组成上 3 计算机网络的功能3.1 数据通信3.2 资源共享3.3 分布式处理3.4 提高可靠性3.5 负载均衡 4 计算机网络的分类4.1 按分布范围分类4.2 按传输技术分类4.3 按照拓扑结构分类4.4 按使用者分类…

网络智能化的发展对仿真环境的需求

1. 网络智能化背景介绍 1.1 什么是网络智能化 网络智能化是指利用人工智能&#xff08;AI&#xff09;、机器学习&#xff08;ML&#xff09;、优化算法等技术来实现网络的信息化、自动化和智能化。相对5G、6G、算力网络等领域&#xff0c;网络智能化是针对网络全场景、全要素…

低调收藏,这份MobaXterm使用指南很全面

中午好&#xff0c;我的网工朋友。 MobaXterm&#xff0c;这个名字对于我们这些经常需要在Windows环境下与Linux服务器打交道的人来说&#xff0c;应该并不陌生。它不仅仅是一个SSH客户端&#xff0c;更是一个功能强大的终端工具箱&#xff0c;集成了X服务器和Unix命令集&…

HiWoo Box工业4G网关

在飞速发展的工业4.0时代&#xff0c;数据已成为驱动工厂智能化、自动化的核心力量。而如何将这些散布在工厂各个角落的数据高效、安全地汇集起来&#xff0c;成为企业提升生产效率、降低运营成本的关键。今天&#xff0c;我们将为您介绍一款4G网关产品——HiWoo Box&#xff0…

【嵌入式模块芯片开发】DWIN的T5L _DGUS应用开发 显示屏的基本图形显示以及串口命令的动态数据波形功能实现

【嵌入式模块芯片开发】DWIN的T5L _DGUS应用开发 显示屏的基本图形显示以及串口命令的动态数据波形功能实现 T5L _DGUS应用在DWIN的各类显示屏中 如DMG80480T070_05WTR等等 可用DWIN官方工具生成一系列上位机显示控件 通过串口命令进行交互实现显示、触摸等功能 也可以进行C51…

【上】王树森《小红书推荐系统公开课》- 课程笔记(推荐系统基础、召回、排序)

写在前面 本文为王树森老师《小红书推荐系统公开课》的课程笔记 课程来源&#xff1a;ShusenWang的个人空间-ShusenWang个人主页-哔哩哔哩视频 (bilibili.com)课程资料&#xff1a;GitHub - wangshusen/RecommenderSystem 由于篇幅较长&#xff0c;分为【上】【下】两篇文章…

HTML静态网页成品作业(HTML+CSS)——动漫海贼王介绍网页(1个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;未使用Javacsript代码&#xff0c;共有1个页面。 二、作品演示 三、代…