红杉资本行业总结篇:生成式 AI 的发展

news2024/12/25 0:05:53

 Datawhale干货 

最新:红杉资本,全球著名风险投资公司

生成式 AI 的发展:从 “快思考” 到 “慢思考”,开启自主应用的新篇章。

在生成式 AI 革命的两年里,研究方向正从 “快思考”(快速预训练响应)向 “慢思考”(推理时的深度思考)转变。这种转变是因为市场基础层已趋于稳定,像微软 / OpenAI、AWS/Anthropic 等巨头形成了竞争格局。

随着大模型市场结构趋于稳定,下一个重点领域正在浮现:焦点正转向推理层的开发和扩展,“系统 2” 思维开始主导。

推理层旨在赋予 AI 系统在推理时进行深度思考、问题解决和认知操作的能力,而不仅仅是快速的模式匹配。它能让 AI 系统像人一样深度思考和解决问题。

40956e481607a8bf8246b3532154e5a0.jpeg

OpenAI 的 o1 模型:推理能力的突破

2024 年最重要的模型更新非 OpenAI 的 o1 莫属(之前称为 Q*,也被称为草莓,Strawberry)。它不仅巩固了 OpenAI 的领先地位,更是首个具备真正通用推理能力的模型,o1 通过“推理时计算”实现了这一点。

ebe3cf1f0cd299e02f33d0b3a13669e4.png

通常预训练模型是在海量数据上进行下一个词元的预测,它们依赖的是“训练时计算”。与传统预训练模型依赖 “训练时计算” 不同,o1 模型则是主动的推理,在回答之前先 “停下来思考”。

那么,当 o1 停下来思考时,它在做什么?

2016 年的 AlphaGo 与李世石的对决是深度学习的重要事件——这是世界看到 AI 不仅仅只是在模仿模式的时刻,它在思考。

078b648ec329d99b0619768e5a1bcfb1.png

AlphaGo 不同于依赖预训练快速反应的模型,它从围棋数据库学习并自我对弈进化,在推理时模拟评估场景选择最佳方案。随着推理时间的增加,AlphaGo 的表现越来越好——直到它超越了最优秀的人类。

而大语言模型复制 AlphaGo 的难点在于构建价值函数,即如何为模型的回答打分。o1 模型的关键思想是通过模型生成的思维链进行强化学习,这和人类的思维和推理方式比较相似。

“强化学习很重要,它正为 AI 开启全新的推理能力层。”

Datawhale 强化学习开源教程:https://github.com/datawhalechina/easy-rl

AI 思维模式的转变:从系统 1 到系统 2 及新扩展法则

AI 正从简单的预训练反应(“系统 1”)向更深层次的更加深思熟虑的推理(“系统 2”)转变。

系统 1 依赖模式模仿,不论是 AlphaGo 通过围棋的数百万步训练出的技能还是大语言模型通过大量的互联网文本进行预训练所训练出的语言能力。但是,模仿,尽管强大,却不是真正的推理。

面对复杂新问题,系统 2 的深度推理至关重要。它要求 AI 探索多种可能,评估结果并基于逻辑推理决策,以应对复杂问题。

839b1f883fb892f25204cc92a82312e0.png

33889fd5e0cdafa1cae781e88eb3de64.jpeg

从 o1 论文得到的最重要见解是,出现了一种新的扩展法则。

预训练大型语言模型遵循投入的计算和数据越多性能越好的法则,而 o1 论文开启了给予推理时间(或“测试时间”)的计算越多推理能力越强的新方式。

1a37281f8ba6a72d8e982887ef76e9d0.jpeg

这种转变将推动从预训练集群向推理云环境的转变,为 AI 发展带来新机遇。

随着 OpenAI、Anthropic、谷歌(Google)和 Meta 不断扩展推理层,开发出更强大的推理机器,会发生什么?我们会迎来一个主导一切的“超级模型”吗?

应用层公司已从基础模型上的简单界面发展为构建复杂认知架构。包括多个基础模型、路由机制、数据库用于 RAG,以及合规和模仿人类思考的逻辑。

4891935489afaafbf7b5c26c7bdecbe2.jpeg

投资方向的分析:各层面的机遇与挑战

作为全球著名风投公司,红杉资本更关注哪里?资金被投入到哪里?

  • 基础设施:基础设施层面是超大规模企业的优势领域,对风险投资家来说不好。

  • 模型:模型层面是超大规模企业和金融投资者的竞争领域。

  • 开发者工具和基础设施软件:对战略投资者吸引力较小,对风险投资家较有吸引力。

  • 应用程序:应用程序层面是风险投资者最感兴趣的,云过渡和移动过渡期间有应用层公司年收入超 10 亿美元,预计 AI 领域也会如此。

aac3e84678bee878ece50af8b521fb7c.jpeg

未来展望

在生成式 AI 的下一个阶段,推理研发会对应用层产生重大影响。当前很多认知架构采用 “解锁” 技术,而未来这些能力会更深地融入模型,代理应用会更强大。

在研究实验室,推理和推断时间计算仍是重要主题,新的拓展法则开启了下一场竞争。

但收集特定领域真实数据和编码认知架构仍有难度,而最后一公里应用提供商在解决复杂现实问题上可能有优势。

考虑到未来,多智能体系统,如工厂的机器人,可能会开始普及,成为建模推理和社会学习过程的方式。

大家都在期待生成式 AI 的「第 37 步」,那一刻——就像 AlphaGo 在与李世石的第二场比赛时一样——一个通用人工智能系统以超出人类的方式,展现出类似独立思考的能力。

这意味这我们已经模拟了感知、推理和行动过程,能让 AI 以新颖有用的方式进行探索,这可能就是 AGI 吧。

等到那个时候,那一步棋将不是偶然事件,而只是技术的下一个阶段。

参考链接:
https://www.sequoiacap.com/article/generative-ais-act-o1/

65caccd422999febe6a1d2aa87970a60.png一起“赞”三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2210162.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mysql(九) --- 事务

文章目录 前言1.什么是事务?2.事务的ACID特性3.为什么要使用事务?4.如何使用事务4.1.查看支持事务的 存储引擎4.2.语法4.3.开启一个事务,执行修改后回滚4.4.开启一个事务,执行修改后提交4.5.保存点4.6.自动/手动提交事务 5.事务的…

[含文档+PPT+源码等]精品大数据项目-springboot基于Hadoop框架实现的高校图书馆阅读书目推荐系统

关于大数据项目——Spring Boot基于Hadoop框架实现的高校图书馆阅读书目推荐系统的课题背景,可以从以下几个方面进行阐述: 一、信息技术发展的推动 随着信息技术的迅猛发展,互联网上的信息数据量呈爆炸式增长。这种信息过载现象使得用户难以…

2014年国赛高教杯数学建模A题嫦娥三号软着陆轨道设计与控制策略解题全过程文档及程序

2014年国赛高教杯数学建模 A题 嫦娥三号软着陆轨道设计与控制策略 嫦娥三号于2013年12月2日1时30分成功发射,12月6日抵达月球轨道。嫦娥三号在着陆准备轨道上的运行质量为2.4t,其安装在下部的主减速发动机能够产生1500N到7500N的可调节推力,…

如何优雅的通过Spring Boot+Redission对订单实现定时关闭

简介 在电子商务及支付相关平台中,常规流程是首先生成订单或支付请求,用户随后会在规定时间内完成支付。如果用户未能在预设时限内完成支付动作,系统通常会执行相应的过期处理机制,即自动取消未支付的订单。 此外,这…

鸿蒙开发之ArkUI 界面篇 三十一 Extend(封装)

开发中遇到重复使用次数多的代码,就是封装提取成一个方法,那么鸿蒙中的方法是怎么封装的呢?下面记录组件属性的封装,语法格式如下: Extend(组件名) function 函数名 (参数, 参数2) { } 例如:封装一个Text…

飞机大战ai通过dqn实现

借鉴 飞机大战源码 github 王者荣耀ai训练(试了一下,发现电脑带不动,就改了一点,训练其他游戏) 源码 通过网盘分享的文件:PlaneWar (2).zip [链接](https://pan.baidu.com/s/1N4OorR7b36Zml8MadGmI6g?pwd1234&#xf…

6.将扩散模型与其他生成模型的关联(2)

1.归一化流与扩散模型 自一化流(Normalizing Flow)是生成模型,通过将易于处理的分布进行变换以队对高维数据进行建模。归一化流可以将简单的概率分布转化为极其复杂的分布,并用于强化学习、变分推理等领域。 现有的归一化流是基于变量替换公式构…

GS-LRM: Large Reconstruction Modelfor 3D Gaussian Splatting 论文解读

目录 一、概述 二、相关工作 1、多视图的三维重建 2、前馈重建 三、LRM 1、编码器 2、解码器 3、NeRF渲染 四、GS-LRM 1、输入处理 2、Transformer 3、损失函数 五、实验 六、局限 一、概述 该论文提出了一种利用稀疏输入图像高效预测3D高斯原语的方法&#xff…

数据结构-5.6.二叉树的先,中,后序遍历

一.遍历: 二.二叉树的遍历:利用了递归操作 1.简介: 二叉树的先序遍历,中序遍历,后序遍历都是以根结点遍历顺序为准的,如先序遍历就先遍历根结点 2.实例: 例一: 例二: …

【LeetCode】动态规划—188. 买卖股票的最佳时机 IV(附完整Python/C++代码)

动态规划—188. 买卖股票的最佳时机 IV 题目描述前言基本思路1. 问题定义交易规则: 2. 理解问题和递推关系两种情况:状态定义:状态转移方程:初始条件: 3. 解决方法动态规划方法特殊情况:当 k 大于等于 pric…

【最新华为OD机试E卷-支持在线评测】构成正方形的数量(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 💻 ACM金牌🏅️团队 | 大厂实习经历 | 多年算法竞赛经历 ✨ 本系列打算持续跟新华为OD-E/D卷的多语言AC题解 🧩 大部分包含 Python / C / Javascript / Java / Cpp 多语言代码 👏 感谢大家的订阅➕ 和 喜欢�…

(全网独家)面试要懂运维真实案例:HDFS重新平衡(HDFS Balancer)没触发问题排查

在面试时,面试官为了考察面试者是否真的有经验,经常会问运维集群时遇到什么问题,解决具体流程。下面是自己遇到HDFS Balancer没执行,花了半天时间进行排查,全网独家的案例和解决方案。 目录 使用CDH自带重新平衡操作…

数据结构 ——— 顺序表oj题:最长公共前缀

目录 题目要求 代码实现 题目要求 编写一个函数来查找字符串数组中的最长公共前缀,如果不存在公共前缀,返回空字符串 "" 代码实现 代码演示: void CommonPrefix(char** strs, int strsSize, char* returnStr) {char* first_r…

利用session机制造测试账号,无需前端也可以测试后端接口

适用场景:我们在测试的时候经常会遇到前端还没有开发完毕,后端已经结束开发了,但是后端的有些接口是需要特定的账号身份调用才会生效,此时因为前端未开发完毕,所以我们不能通过web页面进行登录,那么如何解决…

【Python Django + Vue】酒店在线预订系统:用技术说话!

🎓 作者:计算机毕设小月哥 | 软件开发专家 🖥️ 简介:8年计算机软件程序开发经验。精通Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等技术栈。 🛠️ 专业服务 🛠️ 需求定制化开发源码提…

Parallels Desktop意外退出,Parallels Desktop安装软件很卡闪退怎么办?

Parallels Desktop是目前很优秀的虚拟机软件,操作简单,兼容性强而且安装也非常方便,备受苹果用户的喜爱和满意。然而,部分用户在使用Parallels Desktop的时候,会遇到意外退出或终端关机的情况,这不仅会影响…

VS2017 编译 SQLite3 动态库

首先官方下载源码: Tags sqlite/sqlite (github.com) 1.安装 VS2017 community edition 2.打开VS2017命令行工具 3.安装TCL 开发库,推荐 TCL 9.0 先下载源码: Tcl/Tk 9.0 使用vs2017编译tcl&

CRC码计算原理:按位讲解计算过程

CRC8 这里先以CRC8来说明CRC的计算过程 1、CRC8在线计算器 通过CRC在线计算器可以看见CRC8的特征多项式:x8x2x1,初始值为0000’0000。 CRC计算的核心是:反转异或移位(此处的CRC8没有涉及反转,见后面CRC16&#xff0…

基于Langchain框架下Prompt工程调教大模型(LLM)[输入输出接口、提示词模板与例子选择器的协同应用

大家好,我是微学AI,今天给大家介绍一下基于Langchain框架下Prompt工程调教大模型(LLM)[输入输出接口、提示词模板与例子选择器的协同应用。本文深入探讨了Langchain框架下的Prompt工程在调教LLM(大语言模型)方面的应用&#xff0c…

C++入门基础知识110—【关于C++嵌套 if 语句】

成长路上不孤单😊😊😊😊😊😊 【14后😊///C爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】 今日分享关于C 嵌套 if 语句的相关内容! …