AI时代,百度的三大主义

news2024/11/22 11:28:06

图片

现实主义、长期主义、理想主义


定焦One(dingjiaoone)原创

作者 | 苏琦 郑浩钧

编辑 | 魏佳

“人工智能很像是一次新的工业革命,这意味着它不会三五年就结束,也不会一两年就出现‘超级应用’,它更像是三五十年对于整个社会一次彻底的重构。”

11月12日下午,李彦宏与硅星人创始人骆轶航,以及甲子光年创始人张一甲进行了一场“AI圆桌对谈”,再一次表达了他对AI的信仰,同时阐释了百度在AI上的战略和思考。

这场对谈也是对当天“百度2024世界大会”的延续。世界大会上,李彦宏发布了文心iRAG、无代码工具“秒哒”、自由画布等核心技术和产品,宣告“AI应用的群星闪耀时刻已然到来”。

李彦宏在对谈中表示,将此次百度世界大会的主题定为“应用来了”,是出于“有用”这一价值观。他表示,模型本身不产生直接价值,只有在模型之上开发各种应用,在各种场景找到所谓的PMF(产品市场契合),才能真正产生价值。“如果说2023年大家还在卷模型,让模型能力逐步地达到可用地步的话,那未来所谓的‘可用’,就是真的有东西用,应用的‘用’。”

自百度成立以来,李彦宏一直在AI领域进行前瞻研究和清醒布局。这样的坚守需要定力,也有厚积薄发的力量,不仅能带着百度朝前走,也能给行业带来理性的声音。

李彦宏的布道之路还在继续,他在圆桌访谈中表露心声:“在这条路上,需要长期主义、理想主义和现实主义的结合。”

这三大主义,也在李彦宏多年的AI探索中得到体现。

图片

现实主义:

解决幻觉难题,降低使用门槛

一年前,李彦宏曾呼吁,“大模型本身不仅不产生任何价值,还造成了对公司资源、社会资源的巨大浪费。” 

如果不做通用大模型,创业者应该做什么?当时李彦宏给出的答案是:AI原生应用,“我们需要的不是100个所谓的大模型,而是100万量级的AI原生应用。”

时间过去快两年,超级应用却迟迟没来,原因一方面是部分应用的技术有硬伤,例如文生图幻觉严重,中看不中用;另一方面是应用开发门槛太高,不够智能。在2024百度世界大会上,李彦宏带来两个杀手锏:iRAG(检索增强的文生图技术)和秒哒,解决了上述两大现实存在的技术难题,宣告“AI应用的群星闪耀时刻已然到来”。

图片

百度之所以选择做iRAG,是从现实的用户需求出发进行的倒推。李彦宏在访谈中提到,应用需要大模型能力,而大模型想要具备实用价值就需要有效控制幻觉生成,所以团队开始研究iRAG技术,并开发在ToB场景的应用。

同时,多模态要想进入真正实用阶段,也得有准确性和可控性,应用空间才能打开,这同样离不开iRAG。

iRAG技术作为大模型的一项基础技术,在影视作品、漫画作品、海报制作等几乎所有的创作场景,都能有广泛的应用空间,且可以大幅降低创作成本、提高创作效率。

李彦宏在对谈中举例,比如以前汽车的实拍宣传海报动辄需要十几万元,如果运用iRAG,不仅创作的成本接近于0,还能在保持车该有的形态的前提下,放飞人们的想象,创作出真正有创造力的故事情节,宣传也会更吸引人。

无代码工具“秒哒”的发布也让人兴奋。现在硅谷很重视辅助代码生成,美国很缺工程师,所以现在很多技术和工具都是用来提升这些工程师的效率。

但是百度的思路是,除了能让金字塔塔尖的人更加有效率优势,还想做出一款工具让金字塔中间层和底层的人,都拥有金字塔塔尖这些人的能力。

随着基础模型和智能体的能力逐步提升,百度把这些能力综合在一起,发布“秒哒”,让一行代码都看不懂的人具备程序员的能力。“当几亿、十几亿人都具备这种能力的时候,它对于创造力的爆发,是辅助代码生成工具无法比拟的。”李彦宏表示。

上述两大技术是李彦宏AI现实主义的体现,但这条“实用之路”也是一个逐步发展的过程,不会一蹴而就。“但它是非常有希望的赛道,一个人今天能够写两百行代码,一年以后可能能写两千行代码,再过三年可以写两万行代码,这个能力会逐步发展出来,激发更多人的创造性。”李彦宏在对谈中称。

图片

长期主义:

10年投千亿,应用终爆发

很多人提到巨头做AI和创新,最大的负担是legacy(遗产),但是李彦宏在访谈中直言,百度真正的legacy就是“相信AI”,“一旦你把这个东西当成legacy,很多东西就都很好解释,我就是在做我多年前一直想做的事。无论是深度学习、机器学习还是产品积累,一切都源自百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。”

在大学时期就学习AI相关课程的他,很早就意识到AI是解决搜索引擎问题的核心技术,所以过去10年间百度投入1700亿研发和布局AI。他不仅自己信仰AI,还鼓励公司和社会关注AI,2012年,距离OpenAI成立还有3年,他就发布全员信鼓励全百度产品经理了解AI技术。2013年,他在百度年会上宣布成立深度学习研究院并担任院长。

李彦宏曾在2021年的《致股东信》中写道,“过去10年,我们打基础、建生态,在人工智能大潮奔涌而来的今天,百度成为了领先的AI生态型公司。”

正因为搭好了基础,如今才有了数以千万计的智能体和数十万的产业应用在百度的AI生态中涌现。

百度是少见的将智能体作为最重要战略方向的公司。根据用户的不同需求,李彦宏将智能体分为四类,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。

百度之所以将智能体看得如此重要,不仅因为其开发门槛低、天花板足够高,还看到了智能体与搜索结合,能拓展搜索的边界。

图片

换句话说,百度不仅提供基础大模型和应用开发工具,还提供分发渠道,在百度里搜相应的词,搜出来的结果有可能就是一个智能体。目前,百度新搜索已经成为了智能体分发最大入口,日均分发已超1000万。

李彦宏在访谈中解释,当百度的AI生态里拥有大量智能体的时候,能够将人的需求和智能体进行高效匹配和连接的渠道,还是搜索。同时,人与智能体需要多轮交互,甚至需要调用工具解决问题,这两者的结合拓展了搜索的边界,能打开更多新的可能性。



随着应用开发门槛的降低、智能体的增加,百度文心大模型的调用量也在迅速增长。据百度官方透露,目前文心大模型的日均调用量已超过15亿,较一年前首次披露的5000万次,增长近30倍。

李彦宏在访谈中分享了自己的观察,文心大模型最近两个月调用量的陡升背后是开发者群体的觉醒,他们逐步意识到可以用模型做出应用,这样的需求足够旺盛。

除了智能体,一些像百胜中国、智能招聘这样的公司,也因为和百度的合作,在它们具体的业务场景里,能够更加高效、更加低成本、更加快速的获得实实在在的收益。

百度构建智能产业生态的主要依托是百度智能云。目前在百度智能云的千帆大模型平台上,已经累计精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,60%的央国企以及大量的民营企业,都在联合百度智能云进行AI创新。

目前,百度已经发布基于大模型的100大产业应用,涵盖制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。

图片

理想主义:

从AI拓荒者成为领跑者

虽然此次百度世界大会发布的更多是人人可用的产品,李彦宏的演讲也没有谈很大的命题,但是他身上仍表现出了“理想主义者”的影子。

一方面,百度把很多研发资源投在了“理想主义者”看重的东西上面,李彦宏在访谈中提到,“我们不断地在这方面加大投入、付出努力,没说并不代表没有做”。另一方面,李彦宏过去24年的AI信仰和沉淀,本身就是一种“清醒的理想主义”。

这个清醒体现在面对困境不迷茫,在2020年上海世界人工智能大会上,面对行业的低迷,李彦宏表示当下人工智能所处的阶段,是一个容易产生迷茫甚至悲观的阶段,这是大多数颠覆性技术在加速普及之前的必经阶段。“百度也曾从这样的低谷期爬出来过,所以我相信熬过寒冬就能成为新的英雄。”

这个清醒还体现在,市场冷清时率先布局、耐心坚守;市场热闹时消除噪音,看到潮水真正的流向。

相比于很多其他公司,在2022年11月OpenAI发布ChatGPT后才匆忙进入大模型领域,百度的文心大模型1.0版本早在2019年3月就发布。而当国内生成式大模型的浪潮来袭,李彦宏又呼吁不要卷大模型,应该专注实际场景,重视应用。这样的表态,在当时的环境下需要极大的勇气,事后证明,这其实就是全球主流的AI方向。

图片

2022年底创立的Perplexity.ai,创建了一种高效直接的搜索体验,百度也在去年3月发布文心一言App。到今年,各类以大模型为基础的国产智能助手遍地开花,再一次验证了李彦宏的猜想。

最前沿的技术浪潮是等不来的,浪潮到来前的每一步也都不会白走。这种对AI始终如一的信仰和清醒,给了百度更大的信心和回报。李彦宏带领的百度已经成为一个拥有广泛用户基础的AI生态型公司:在深度学习、对话式人工智能操作系统、自动驾驶等前沿领域均已深度布局。

过去三十年,中国的电脑行业和手机行业飞速发展,但遗憾的是,在这两个行业中,还没有出现中国操作系统巨头,李彦宏更大的理想,或许是让百度成为AI时代“操作系统”的最后胜利者。“我们的主要精力放在做工具、做基础平台,让大家更容易的在这上面开发应用。”

对于百度来说,搭建基础设施,在把自身优势放到最大的同时带动更多人一同开发创造,这是比取得某个单项赛道的胜利更有想象力、更有价值的事情。

2021年李彦宏在《致股东信》中曾写道,“每当百度徘徊在十字路口,我都会问自己,什么才能够让人真正制胜未来?”他给自己的答案是两方面:一是你信仰什么,二是你有多大的决心。

过去24年,李彦宏和百度对AI的信仰没有一丝改变,唯一改变的是,他们正在离自己的信仰越来越近。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2244627.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

服务器Docker OOM RSS高问题排查思路

优质博文:IT-BLOG-CN 防走弯路为防止走弯路,强烈建议先仔细阅读以下加粗内容: 如果你的应用是因为公司最近降成本调小实例物理内存才出现docker oom,而之前从来没有出现过,那么大概率是堆内存太大导致,这种…

Ubuntu Linux使用前准备动作_使用root登录图形化界面

Ubuntu默认是不允许使用 root 登录图形化界面的。这是出于安全考虑的设置。但如果有需要,可以通过以下步骤来实现使用 root 登录: 1、设置 root 密码 打开终端,使用当前的管理员账户登录系统。在终端中输入命令sudo passwd root&#xff0c…

core 不可变类型 线程安全 record

当一个类型的对象在创建时被指定状态后,就不会再变化的对象,我们称之为不可变类型。这种类型是线程安全的,不需要进行线程同步,非常适合并行计算的数据共享。它减少了更新对象会引起各种bug的风险,更为安全。 System.D…

Python-简单病毒程序合集(一)

前言:简单又有趣的Python恶搞代码,往往能给我们枯燥无味的生活带来一点乐趣,激发我们对编程的最原始的热爱。那么话不多说,我们直接开始今天的编程之路。 编程思路:本次我们将会用到os,paltform,threading,ctypes,sys,…

ForEach刷新UI机制

官网地址:ForEach 在ArkUI中,提供了ForEach循环语句,用来初始化一个列表数据,我们知道,当ForEach中的数组发生变化时,会引起UI的刷新,但是究竟如何变化,会引起UI怎样的刷新&#xf…

如何解决pdf.js跨域从url动态加载pdf文档

摘要 当我们想用PDF.js从URL加载文档时,将会因遇到跨域问题而中断,且是因为会触发了PDF.js和浏览器的双重CORS block,这篇文章将会介绍:①如何禁用pdf.js的跨域?②如何绕过浏览器的CORS加载URL文件?②如何使…

Three.js 相机控制器Controls

在 3D 场景中,摄像机的控制尤为重要,因为它决定了用户如何观察和与场景互动。Three.js 提供了多种相机控制器,最常用的有 OrbitControls、TrackballControls、FlyControls 和 FirstPersonControls。OrbitControls 适合用于查看和检查 3D 模型…

C++小白实习日记——Day 5 gitee怎么删文件,测试文件怎么写循环

昨晚一直内耗,一个程序写了三天写不出来,主要是耗时太多了,老板一直不满意。想在VScode上跑一下,昨晚一直报错。今天来公司重新搞了一下, 主要工作有: 1,读取当前时间用tscns 2,输…

【从零开始的LeetCode-算法】3301. 高度互不相同的最大塔高和

给你一个数组 maximumHeight ,其中 maximumHeight[i] 表示第 i 座塔可以达到的 最大 高度。 你的任务是给每一座塔分别设置一个高度,使得: 第 i 座塔的高度是一个正整数,且不超过 maximumHeight[i] 。所有塔的高度互不相同。 请…

利用uniapp开发鸿蒙:运行到鸿蒙模拟器—踩坑合集

从uniapp运行到鸿蒙模拟器上这一步,就有非常多的坑,一些常见的坑,官网都有介绍,就不再拿出来了,这里记录一下官网未记录的大坑 1.运行路径从hbuilderx启动鸿蒙模拟器 解决方法: Windows系统,官…

基于UDP和TCP实现回显服务器

目录 一. UDP 回显服务器 1. UDP Echo Server 2. UDP Echo Client 二. TCP 回显服务器 1. TCP Echo Server 2. TCP Echo Client 回显服务器 (Echo Server) 就是客户端发送什么样的请求, 服务器就返回什么样的响应, 没有任何的计算和处理逻辑. 一. UDP 回显服务器 1. UD…

游戏引擎学习第17天

视频参考:https://www.bilibili.com/video/BV1LPUpYJEXE/ 回顾上一天的内容 1. 整体目标: 处理键盘输入:将键盘输入的处理逻辑从平台特定的代码中分离出来,放入更独立的函数中以便管理。优化消息循环:确保消息循环能够有效处理 …

Ubuntu常见命令

关于export LD_LIBRARY_PATHcmake默认地址CMakelists.txt知识扩充/home:挂载新磁盘到 /home 子目录 关于export LD_LIBRARY_PATH 程序运行时默认的依赖库的位置包括lib, /usr/lib ,/usr/local/lib 通过命令export LD_LIBRARY_PATHdesired_path:$LD_LIBRARY_PATH追加…

Linux驱动开发快速入门——字符设备驱动(直接操作寄存器设备树版)

Linux驱动开发快速入门——字符设备驱动 前言 笔者使用开发板型号:正点原子的IMX6ULL-alpha开发板。ubuntu版本为:20.04。写此文也是以备忘为目的。 字符设备驱动 本小结将以直接操作寄存器的方式控制一个LED灯,可以通过read系统调用可以…

论文阅读 SeedEdit: Align Image Re-Generation to Image Editing

目录 摘要 1 INTRODUCTION 2 SEEDEDIT 2.1 T2I MODEL FOR EDITING DATA GENERATION 2.2 CAUSAL DIFFUSION MODEL WITH IMAGE INPUT 2.3 ITERATIVE ALIGNMENT 3 EXPERIMENTS 3.1 BENCHMARK AND METRICS 3.2 IMAGE EDITING COMPARISON 4 CONCLUSION 摘要 SeedEdit&…

代码随想录算法训练营day41|动态规划04

最后一块石头的重量|| 返回剩余最后一块石头石头最小的可能重量,那么就应该最后剩余的两块石头尽量都等于或接近总重量的一半,这样剩下的就是一半的质量 目标和 给定一个非负整数数组,a1, a2, …, an, 和一个目标数,S。现在你有…

【C++】绘制内存管理的地图

生活是属于每个人自己的感受,不属于任何人的看法。 前言 这是我自己学习C的第二篇博客总结。后期我会继续把C学习笔记开源至博客上。 上一期笔记是关于C的类与对象础知识,没看的同学可以过去看看: 【C】面向对象编程的艺术之旅-CSDN博客https…

【AI大模型引领变革】探索AI如何重塑软件开发流程与未来趋势

文章目录 每日一句正能量前言流程与模式介绍【传统软件开发 VS AI参与的软件开发】一、传统软件开发流程与模式二、AI参与的软件开发流程与模式三、AI带来的不同之处 结论 AI在软件开发流程中的优势、挑战及应对策略AI在软件开发流程中的优势面临的挑战及应对策略 结论 后记 每…

前端访问后端实现跨域

背景&#xff1a;前端在抖音里做了一个插件然后访问我们的后端。显然在抖音访问其他域名肯定会跨域。 解决办法&#xff1a; 1、使用比较简单的jsonp JSONP 优点&#xff1a;JSONP 是通过动态创建 <script> 标签的方式加载外部数据&#xff0c;属于跨域数据请求的一种…

《Vue零基础入门教程》第二课:搭建开发环境

往期内容&#xff1a; 《Vue零基础入门教程》第一课&#xff1a;Vue简介 1 搭建开发环境 Vue环境分为两种 不使用构建工具使用构建丁具 首先&#xff0c;我们会介绍 不使用构建工具 的环境,在组件化章节中介绍 使用构建工具 的方式 1) 初始化 使用如下指令初始化 npm i…