百度的新想象力在哪?

news2025/1/16 9:01:17

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。 

作者|皮爷 

出品|产业家 

沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下,雪白的坡道在给人质感的同时,也更多了几分厚重——这里是刚刚过去的冬季奥运会自由滑板大跳台和单人滑板大跳台项目的举办地,伫立在首钢园的它也是当今全世界唯一一个永久保留的滑雪大跳台。

今天,这里是百度的主场。

关于百度,在过去的一年里很难有人忽视掉这家老牌中国互联网企业。不论是在大模型浪潮里代表中国的“率先出战”,还是其大模型产品在技术参数和落地上的一个个动作,再或者是百度在自身各个产品线上的AI重构,每一个事件和节点都在成为着中国大模型舞台上的核心事件之一。

这些成绩在展示着中国AI企业的特殊加速度背后,也更在让外界重新认识和理解百度——在All in AI多年后,有一身“极客”气质的百度终于站在了自己的专属舞台上。

不过如今,和它一起出现再次出现在“百度世界大会”舞台上的,不仅是大模型本身,还有百度各个“换上新装”的一众明星产品:百度文库、百度文档、百度网盘等等……

现在的百度,是一个怎样的百度?又或者说,伴随着AI大模型浪潮蜂拥而来的,除了文心大模型,百度在发生的改变还有什么?

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。

一、大模型潮水里的百度时刻

“我们是全球科技大厂里最先发布大模型的公司。”在今年的3月16日,始终身穿一身白衬衫出现在公众面前的李彦宏向外界发布了百度文心大模型。

而在7个月过后的今天,这个被率先发布的互联网大厂大模型有了新的成绩单——文心大模型4.0版本正式发布。客观来看,这是目前国内唯一一个可以对标GPT-4的大模型产品。

这意味着什么?

过去几个月的时间里,大模型浪潮蜂拥而来。根据中国新一代人工智能发展战略研究院发布的《2023中国新一代人工智能科技产业发展报告》数据显示,目前国内大模型数量超过200家,其中参数量级超过10亿的模型数接近80个。

这些模型不仅是基础模型,更多的则是产业模型,比如面向金融、教育、工业、农业等不同的产业方向,它们都在成为着大模型的价值自证地和新机会市场。

但在其中,百度文心大模型仍然是尤为特殊的一个。

能力本身是大模型绕不开的必考卷。从时间线来看,在百度推出文心一言模型后的2个月后,百度正式宣布文心大模型正式从 3.0 升级到3.5,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍。

这个升级在IDC发布的《AI大模型技术能力评估报告,2023》中有足够清晰的例证。即百度文心大模型3.5在12项相关指标测试中,拿下了7个满分,包括综合评分、算法模型、行业覆盖等均取得了第一名。

而如今的4.0版本尽管被社会层面的验证仍然在路上。但根据官网数据显示,文心大模型4.0,相比3.5版本,逻辑和记忆能力有显著的提升,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。此外,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。

此外,能力之外,场景更是当下大模型被检验的核心指标。在面向产业端的市场中,百度智能云发布了千帆平台,为企业提供“大模型超级工厂”服务。而这个方案的数据是,从今年3月份以来,它已经服务了超过17000家客户,在超过400个场景中实现了落地。

而在这些之外,百度的更特殊之处在于对自身的重新重塑,在在这次大会上重磅亮相的百度文库、百度文档、百度网盘等产品背后,对应的是百度自身对于AI的深度应用和理解,即基于文心大模型,百度真正肉眼可见的进入AI-native时代。

实际上,在过去的几个月时间里,人们对于大模型的讨论始终不绝于耳。从最开始单纯追求参数,到后来的重视场景,再到如今的AI原生应用,对应的一方面是人们对于大模型技术愈发趋向理性和冷静的观察,另一方面也更是大模型本身在实际发展不同阶段的不同核心命题——从技术到场景到AI应用。

而伴随着这些不同的命题,对应的是舞台中央不断轮换的企业,比如技术至上的极客公司,比如有专有产业数据的产业模型企业,再比如具备产品开发能力的产品模型创业者等等。但在舞台中央,在不同的阶段,百度却始终都在聚光灯下。

不论是芯片算力、还是场景落地,再或者是生态开放和AI原生应用等等,在每一个大模型的棱面上,百度始终会是那个率先出击的企业,最终也恰构成了这次百度世界大会给外界展示出的大模型“多面体”。

或者可以说,百度在成为引领者、亲历者的同时,也更在成为一面中国大模型企业出击的“时刻”标签。

二、谁在推动AI奇点?

2019年,在小说《三体》出版后,刘慈欣还写了一篇名为《技术奇点》的文章,在文章中他写到,“什么是技术奇点?是技术的进步可能由量变产生突然的质变,在极短的时间里彻底改变人类世界的状态。”

而这个词,在如今的大模型时代更是被再次提及。即在大模型时代里,什么才是真正的奇点?又或者说,什么才是真正的推动大模型普惠的最直接路径?

如果说从技术到场景,对应的是大模型缓慢前行的过程。那么,在此之外一个更为直接的答案则是应用,更具体来说,则是基于大模型技术的应用。

“应用的最关键价值在于,它能让技术变得可见、可用和可感。”一位观察大模型的投资人告诉产业家,“它能强化大模型的普惠效应。”

这也正是百度的思考。以这次大会为例,百度内部诸多应用都在成为AI驱动的应用,比如百度文库,其升级为“一站式智能文档平台”,接下来其将不仅具备之前的信息查阅功能,更具备"PPT智能生成、文档智能生成、智能编辑、智能辅助阅读"等核心AI能力。

再比如百度网盘,其主打的网盘智能助理“云一朵”是国内首个网盘智能助理,用户只需要一句话,就能对网盘内的文件、图片、视频等进行操作,方便用户在网盘里、视频里“找东西”。同样还有百度地图,基于文心大模型进行重构的百度地图V19,将上线全新“AI向导”,它将具备多轮自然语言交互能力,更接近“真人交流”体验。

可以理解为,百度正在将固有的产品界面基于大模型进行重新解构,这种解构不再是之前的产品功能优化,而是基于新的交互方式和强大的中文知识图谱做支撑,进行更为彻底的从交互到产品功能的重构。

实际上,这也恰是当下大模型强化技术标签的最强社会信号。

即伴随着大模型的技术推进,越来越多的共识是这项技术将会率先在产业侧落地,其基于大模型本身对数据的重新训练和表达可以转化为更先进的生产力,帮助企业实现更快速的数字化转型。

这种思考诚然如此,但在这之外,更关键的点在于对于C端人群语法凸显的一个问题是——“大模型是什么?”。在单纯的一问一答之外,大模型的更多元表达会是什么?

这个问题知易行难。对于中国互联网市场的一众产品而言,需要被重新架设的不仅是固有的产品思维,也更是在其上需要被重点强化的领域知识图谱和数据,以及足够强大的能支撑C端人群的算力底层。

可以理解为,百度的这些应用重构,恰是这个难题的答案。即作为兼备明星产品和坚实模型能力的互联网企业,百度是为数不多的可以将两者进行加法的科技厂商,这些最中文语义最强的知识图谱被拆解成具体的模块,经过特殊的微调和强化,和不同的产品形态进行特殊的加法,或乘法。

不过,从某种层面来看,这些应用也恰构成着百度或者说大模型企业在当下数字化时代的特殊飞轮,即通过应用可以对大模型进行更广和更深的数据训练和加持,基于现象级落地实现大模型自身的优化升级。

这是百度锚定的奇点,也更是一个大模型进化的必然奇点。

三、中国大模型拼图里,重新理解百度

实际上,在一众的节点之中,百度正在成为一个不同的百度。如果说百度之前的标签是搜索、是营销,那么如今百度更核心的标签恰是AI大模型。

这种变化足够鲜明。从整个产品矩阵来看,不论是百度最核心的搜索,还是百度文库、百度网盘、百度地图、百度营销,乃至其他板块的小度科技、度小满金融等等,都已然基于大模型构建出自己的新形态。

恰如李彦宏在会上所说,

就当下而言,在整个中国大模型的版图里,百度更可以看作是一个足够清晰的AI样板间。基于文心大模型,这家企业的产品、商业模式都在发生肉眼可见的变化,这些变化也恰在给市场和用户提供一种特殊的大模型普惠的使用方式——大模型被具象为更加专用的产品场景,帮助人们更好地解构数据和获取知识。

而在这种变化背后,对应的是如今百度文心大模型4.0更为强大的理解和逻辑能力,以及底层充分的算力支撑。

这些构成的是如今的新百度。在这个新的百度身上,看到的是新智能化的产品矩阵,新被拓宽的商业空间天花板和新的愈发广阔的新想象力。

当然,也更有对技术的始终专注和坚持。根据财报数据显示,百度核心研发费用占百度核心收入比例已连续7个季度超过20%,而这些研发的数字在如今的大模型时代,恰在从质变走到量变,转化成一个个百度重新出发的原点。

实际上,百度的变化也更在被市场所看见。在刚刚过去的9月7日晚,《时代》周刊发布了首届全球百大AI人物,百度创始人、董事长兼首席执行官李彦宏、特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等被评为全球AI领袖。《时代》给李彦宏的评语是,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。

更客观的表达是,在当下的AI时代,百度多年的默默坚持正在被转化为加速出发的动力。在这一轮的大模型潮水里,“百度时刻”在加速到来,属于百度的中央舞台也正在缓缓驶来。

仍记得一组数据——8 月 31 日,文心一言率先向全社会全面开放,从0 点至 24 点,文心一言共计回复网友超 3342 万个问题。

或许,多年之后再看这个时间点,它是许多人在大模型时代推开的第一扇大门,也更是新百度的推开的第一扇窗。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1111513.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

9.构造器与垃圾收集器 对象的前世今生

9.1 对象与变量的生存空间 栈与堆:生存空间 在Java中,程序员会在乎内存中的两种区域:对象的生存空间堆(heap)和方法调用及变量的生存空间(stack)。当Java虚拟机启动时,它会从底层的…

CSS之Flex布局的详细解析

Flex布局 目标:熟练使用 Flex 完成结构化布局 01-标准流 标准流也叫文档流,指的是标签在页面中默认的排布规则,例如:块元素独占一行,行内元素可以一行显示多个。 02-浮动 基本使用 作用:让块元素水平排列…

【生成模型】DDPM概率扩散模型(原理+代码)

--- 前言一、常见生成模型二、直观理解Diffusion model三、形式化解析Diffusion model*四、详解 Diffusion Model(数学推导)1.前向过程(扩散过程)2.逆扩散过程3.逆扩散条件概率推导4.训练损失 五、训练、测试伪代码1. 训练2.测试 六、代码解析1.train_ci…

进程的描述、控制与通信

一、概念 进程的状态 进程的最基本状态 就绪态执行态阻塞态 为保证完整性,再引入两种状态 创建态终止态 引入挂起操作后,引入的状态 活动就绪静止就绪活动阻塞静止阻塞 挂起:当挂起操作作用于某个进程时,该进程将被挂起&…

基于LSTM时间序列预测(简单又好用)无脑代码

# 基于LSTM时间序列预测(简单又好用)无脑代码, 这里是列表文本使用很简单,跟着注释和使用手册用就行. 简介: 1、单变量,多变量输入,自由切换 2、单步预测,多步预测,自动…

1.集合框架

一、JDK版本之间的关系 1.1、Oracle JDK与OpenJDK的区别 1.Oracle JDK是基于OpenJDK源代码构建的,因此Oracle JDK和OpenJDK之间没有重大的技术差异。 2.Oracle JDK将更多地关注稳定性,它重视更多的企业级用户,而OpenJDK经常发布以支持其他性能…

电子技术基础(三)__第7章 时序逻辑电路_第6篇__时序逻辑电路的分类

时序逻辑电路的分类, 通常按两种来分类: 按逻辑功能, 按触发器状态的变化规律。 一. 同步、异步的定义 同步时序逻辑电路 是 所有触发器有一个共同的时钟控制信号CP, 在CP脉冲信号的作用下,触发器状态的变化同时发生,…

40G光模块的兼容性与协议标准

40G光模块的兼容性与标准化是确保光通信系统稳定运行的关键因素。在下文中,易天光通信将对40G光模块的兼容性和标准化进行分析和讨论。 一、关于40G光模块的兼容性方面 40G光模块的兼容性主要涉及两个方面:光接口的兼容性和协议的兼容性。 光接口兼容…

零基础如何自学C#?

前言 本文来源于知乎的一个提问,提问的是一个大一软件工程专业的学生,他想要自学C#但是不知道该怎么去学,这让他感到很迷茫,希望有人能给他一些建议和提供一些学习方向。 个人建议 确认目标:自学C#首先你需要大概了解…

“第四十四天”

这道题也不是难,但可能会忽略一种情况,当最大小出现在首位的时候,那个时候如果进行交换的话,大小值可能出现覆盖的情况,最终导致丢失最大值或者最小值,比如最大值 10 在第一位,最小值 0 随意&am…

对电动汽车的高压互锁的理解

什么是高压互锁系统 什么是高压互锁系统?高压互锁系统(HighVoltageInter-lock,简称HVIL),也叫高压互锁回路系统(HazardousVoltageInterlockLoop) 高压互锁的原理 高压互锁是利用低压回路的检测信号来判断高压回路每个高压接插件各自是否连…

文件管理系统的基本认识

1.文件的属性 文件的定义:一组有意义的信息的集合。 1.文件名: 由创建文件的用户决定文件名,主要是为了方便用户找到文件,同一目录下不允许有重名文件。 2.标识符: 一个系统内的各文件标识符唯一,对用户来说毫无可读性, 因此…

C++实现AC自动机,剪枝、双数组压缩字典树!详解双数组前缀树(Double-Array Trie)剪枝字典树(Patricia Trie)

代码在:github.com/becomequantum 最近研究了一下字典树,什么AC自动机,双数组压缩字典树,剪枝字典树都自己写代码实现了一下。这本该是本科学数据结构时该玩明白的东西,我到现在才会玩。本视频主要介绍一下双数组和剪…

Stanford CS224N - word2vec

最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课,弥补一下之前nlp这块基础知识的一些不清楚的地方,顺便巩固一下基础知识😁 关于word2vec: 1.为什么要把单词表示成向量 一开始人们造了一个类似于词典表…

【系统与工具】系统环境——VMware安装系统

文章目录 0.1 安装VMware0.2 下载ubuntu镜像0.3 创建系统实例0.4 安装ubuntu0.5 实例配置项0.5.1 安装VMware tools0.5.2 修改静态IP0.5.3 ssh连接 0.6 克隆0.6.1 克隆实例生成MAC地址 0.6.2 修改静态ip0.6.3 修改主机密码名称 参考:https://blog.csdn.net/m0_51913…

MySQL字段的字符类型该如何选择?千万数据下varchar和char性能竟然相差30%?

MySQL字段的字符类型该如何选择?千万数据下varchar和char性能竟然相差30%? 前言 上篇文章MySQL字段的时间类型该如何选择?千万数据下性能提升10%~30%🚀我们讨论过时间类型的选择 本篇文章来讨论MySQL中字符类型的选择并来深入实践char与varchar类型…

DVWA-JavaScript Attacks

JavaScript Attacks JavaScript Attack即JS攻击&#xff0c;攻击者可以利用JavaScript实施攻击。 Low 等级 核心源码&#xff0c;用的是dom语法这是在前端使用的和后端无关&#xff0c;然后获取属性为phrase的值然后来个rot13和MD5双重加密在复制给token属性。 <script&…

成集云 | 成销云移动商城集成用友NC | 解决方案

方案产品介绍 成销云移动商城系统&#xff0c;支持商品管理、会员管理、营销活动、订单管理等多种模块功能&#xff0c;帮助企业解决时间、库存和服务方面的难题&#xff0c;助力企业实现数字化产业升级。 用友NC是用友NC产品的全新系列&#xff0c;是面向集团企业的世界级高…

09-Vue基础之实现注册页面

个人名片&#xff1a; &#x1f60a;作者简介&#xff1a;一名大二在校生 &#x1f921; 个人主页&#xff1a;坠入暮云间x &#x1f43c;座右铭&#xff1a;懒惰受到的惩罚不仅仅是自己的失败&#xff0c;还有别人的成功。 &#x1f385;**学习目标: 坚持每一次的学习打卡 文章…

企业IT资产设备折旧残值如何计算

环境&#xff1a; 企业/公司 IT资产 问题描述&#xff1a; 企业IT设备折旧残值如何计算&#xff1f; 解决方案&#xff1a; 1.按三年折旧 净值原值-月折旧额折旧月份 &#xff0c; 月折旧额原值(1-3%)/36 折旧月份ROUND(E2*(1-3%)/36,2) 2.净值E2-F2*G2