『深度分析』Kimi版o1来了!Kimi探索版全面解读!

news2024/11/24 14:49:16

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

推理者(Reasoners),位于OpenAI提出的从AI到AGI五级分类系统中的第二阶段。推理者与基础AI(Emerging AGI)——当前大多数AI系统——的一大区别在于其推理能力以及复杂问题的解决能力。推理AI不依赖外部信息源来获取答案,而是通过已有的知识及内部推理来解决复杂问题。这一点是不是和我们人类的认知-学习-应用一样,先学习现有知识,然后根据这些知识基础来构建推理链条从而应用到现实问题上。

OpenAI不久前发布的推理模型o1让所有人看到了AI模型进化的另一个方向。作为一款AI模型,它的知识水平和推理能力与博士级别相当,更是在国际数学奥林匹克(IMO)考试中达到了惊人的83%正确率,其“智商”可见一斑。

国内的AI厂商摩拳擦掌,纷纷跟进,以Kimi和智谱为首,推出了类似的推理型AI产品。本篇文章的主角就是由月之暗面于10月11日正式推出的推理AI搜索产品Kimi探索版

Kimi探索版是什么?简单来说,Kimi探索版是一款融合了类似o1模型的推理功能(内部思维链)的AI搜索工具。本质上它是一个AI搜索工具,一款产品,而非一个AI模型。这个AI搜索工具和AI Agent一样,拥有推理(Reasoning)、规划(Planning)、工具调用(Tool Use)和反馈(Reflection)的能力。

  1. 推理(Reasoning)和规划(Planning):推理规划是我们人类解决复杂问题的第一步,AI也是如此。面对一个复杂问题,我们通常先对问题进行全面分析,拆解为多个子问题,然后规划出解决路径。这种思维方式被称作“思维链(Chain of Thought)”。OpenAI的o1模型为什么有如此强大的推理能力,就是因为其内部思维链。

  2. 工具调用(Tool Use):LLM模型本身不具备第三方工具调用的能力,如联网搜索,但AI Agent智能体)可以。Kimi探索版就像是这么一个AI Agent,它拥有调用外部工具的能力,如Web搜索引擎,这样使得模型能够处理其自身能力范围之外的任务。

  3. 反馈(Reflection):反馈是AI Agent设计中的一种重要方式:通过自我反思和迭代改进来提高AI模型对于复杂任务执行能力。根据月之暗面官方的介绍,Kimi探索版在AI搜索的最后一步也拥有反馈和自我修正的能力:对生成的结果进行反思,检查信息是否存在遗漏或错误,并在必要时补充或修改答案。这其实不难理解,因为Kimi探索版其实就是一个伪装的AI Agent。

为什么需要Kimi探索版?主要原因之一就是当前大多数AI搜索工具都还停留在初级搜索阶段。何为初级搜索阶段?就是虽然能够提供较为全面的信息检索,但依然局限于关键词匹配与基础的文本分析。综合来看,只能满足简单的信息搜索需求,比如查询天气,查询百科知识,查询历史事件等。而面对复杂问题时,传统的AI搜索工具很容易陷入信息拼凑的局限,给出的结果往往信息量大但实用性低,用户还需自行从冗长的结果中筛选有用的信息。比如旅行规划,得到的结果往往是搜索信息的简单拼凑,答案缺乏深度推理思考。

Kimi探索版可以算是AI搜索PLUS,加入了推理能力的增强型AI搜索工具。这算是推理模型/能力在AI搜索方向一个非常好的尝试和应用了。

附上Kimi探索版产品负责人很自信的说法:“如果Kimi搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。”

如何体验Kimi探索版

https://kimi.moonshot.cn/

目前Kimi探索版只支持Web网页端,手机App端暂时没有上线该功能。并且,Kimi探索版作为一个高级功能,目前每人每天有着5次的使用限制。这个限制算是只能尝个鲜了。

按照上面的链接打开Kimi的网页,首页就可以看到Kimi探索版的推荐。共有两种方式进入探索版,一种是在输入框里输入斜杠字符:“/”,然后点击Enter回车键。

第二种进入Kimi探索版的方式是打开输入框左下角探索版的开关,即可直接进入探索版。

Kimi探索版初体验

要想测试Kimi探索版,需要提问一个比较复杂的搜索问题。怎么算复杂?用传统的搜索引擎一步查询不到结果的都可以算作是复杂任务。比如下面这个。

如何应对2024年中国新能源汽车市场竞争加剧的趋势?各大厂商的战略是什么?

对于这个问题,传统的搜索引擎肯定是搞不定的,一来需要搜索的内容过多,二来不但需要搜索到内容,还需要对其进行整合、分析,最终得出答案。

Kimi探索版给出的答案是这样的。

点评

综合来看,信息检索的速度很快,符合Kimi官方对于这个新功能的描述。在几十秒阅读了127个网页。Kimi探索版给出的信息比较详尽且覆盖面广,共提供了12家主要新能源汽车厂商的战略概述,基本涵盖了所有国内外的领先企业。信息源的及时性和准确性也还可以,基本都是来自2024年的行业数据和新闻报道。

但从上面的回答也可以看出,虽然Kimi探索版是把检索到的海量信息进行了汇总整理,但缺乏深入的行业趋势分析,对于每一条战略分析的深度有待加强,目前看起来仅仅是对信息的堆砌,每个战略一句话就带过了。此外,虽然给出了各大厂商的战略,但不同厂商的策略之间的竞争性和差异性没有进行足够的对比分析。因此,在这个测试案例中,Kimi探索版的推理能力没有特别突出的表现。

结语

Kimi探索版,Kimi版的o1,对AI搜索有要求的小伙伴可以体验起来了!


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2208062.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

28幅高清修复的英文版中国地图

我们在《183幅值得珍藏的全国地质图集》和《55幅值得珍藏的水文地质图集》两文中,为你分享过精美的全国地质图和水文地质图。 现在我们整理了28幅英文版中国地图,并经过高清修复后分享给大家,你可以在文末查看该数据的领取方法。 28幅英文版…

Channel模块 --- 管理套接字事件

目录 设计思想 实现 设计思想 Channel模块是用于对一个描述符所需要监控的事件以及事件触发之后要执行的回调函数进行管理的 具体来说,它里面会保存该文件描述符所监控的事件,该文件描述符所就绪的事件,以及该描述符的各种事件的处理回调…

4 机器学习之归纳偏好

通过学习得到的模型对应了假设空间中的一个假设。于是,图1.2的西瓜版本空间给我们带来一个麻烦:现在有三个与训练集一致的假设,但与它们对应的模型在面临新样本的时候,却会产生不同的输出。例如,对(色泽青绿…

java算法oj(3)栈和队列

目录 1.前言 2.正文 2.1基础操作 2.2用栈实现队列 2.2.1题目 2.2.2示例 2.2.3代码 2.3用队列实现栈 2.3.1题目 2.3.2示例 2.3.3代码 2.4最小栈 2.4.1题目 2.4.2示例 2.4.3代码 3.小结 1.前言 哈喽大家好吖,今天来分享几道栈与队列的算法题&#…

三、AOP

文章目录 1. AOP(概念)2. AOP(底层原理)2.1 AOP 底层使用动态代理2.2 AOP(JDK动态代理) 3. AOP(术语)3.1 连接点3.2 切入点3.3 通知(增强)3.4 切面 4. AOP操作…

数据丢失不再怕!四款数磁盘数据恢复据恢复工具实测心得

在办公室行政的工作中,数据恢复工具是我们不可或缺的帮手。无论是不小心删除了重要文件,还是硬盘突然罢工,这些工具总能在关键时刻帮我们力挽狂澜。今天,我就来分享一下我使用福昕数据恢复、转转大师数据恢复、超级兔子数据恢复和…

MySQL 【数字】函数大全(二)

MODPIPOWPOWERRANDROUNDSIGNSQRTTRUNCATE 1、MOD MOD(number1, number2) :返回一个数字除以另一个数字的余数。 语法: 1、MOD(number1, number2) 2、number1 MOD number2 3、number1 % number2 number1:被除数。 number2:除数。…

Qt学习系列之设计模式的小记录

Qt学习系列之设计模式的小记录 前言Qt中的设计模式使用情况数据模型视图组建代理 小tips虚函数:基类的不同具体使用界面设计后台显示 报错解决 总结 前言 在软件设计师中的设计模式有提到设计模式有三种类型: 创建型:工厂方法模式、抽象工厂…

上海AI实验室CVT-Occ时间融合利用视差搜索刷新occ3DWaymo SOTA

上海AI实验室提出CVT-Occ:通过时间融合利用视差搜索刷新occ3D-Waymo SOTA Abstract 基于视觉的3D占据预测由于单目视觉在深度估计上的固有局限性而面临显著挑战。本文介绍了CVT-Occ,一种新颖的方法,通过时间上的体素几何对应进行时间融合&a…

华为OD机试 - 最快到达医院的方法(Python/JS/C/C++ 2024 E卷 100分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试真题(Python/JS/C/C)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,…

欧洲气象局开源数据如何通过大模型预测未来天气

气象预测依赖于全球各地的观测数据、复杂的数学模型和高性能计算资源。欧洲气象局(ECMWF,European Centre for Medium-Range Weather Forecasts)作为世界领先的气象预报机构,不仅提供精确的天气预报服务,还向公众和科研…

获取鸿蒙设备Udid遇到的问题

参考官方文档:注册调试设备-调试应用(HarmonyOS)-AppGallery Connect帮助中心 - 华为HarmonyOS开发者 (huawei.com) 坑一:The sdk hdc.exe version is too low, please upgrade to the latest version. 升级dev工具和sdk配置为api…

google域名邮箱:如何创建并管理邮箱账户?

google域名邮箱设置教程?如何开通Google域名邮箱? Google域名邮箱提供了一个专业且功能强大的平台,允许用户使用自定义域名创建和管理邮箱账户。烽火将详细介绍如何创建并管理Google域名邮箱账户,帮助您充分利用这一强大的工具。…

Java Mail腾讯企业邮箱或其他邮箱发送邮件失败bug记录

问题出现情况 邮件发送时debug用F8逐步运行可以成功发送邮件,但是用F9或者直接运行程序却发送失败未开启mail的debug模式的报错日志是下面这个:org.springframework.mail.MailAuthenticationException: Authentication failed; nested exception is java…

基于RPA+AI的网页自动填写机器人 | OPENAIGC开发者大赛高校组优秀作品

在第二届拯救者杯OPENAIGC开发者大赛中,涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到,我们特意开设了优秀作品报道专栏,旨在展示其独特之处和开发者的精彩故事。 无论您是技术专家还是爱好者,希望能带给…

TXS0104 LSF0102 原理理解

具体参数请查看数据手册,在此不必赘述了。TXS0104 数据手册 现主要对TXS0104 结构原理进行解析: 电平转换电路结构可参考如下电路: 对于gate bias 部分电路具体细节有兴趣的可以了解下。 对于LSF0102 系列的电平转换芯片 LSF0102 数据手…

【人工智能学习之PaddleOCR训练教程】

具体的训练教程: 准备数据集 OCR数据集 (以下文字转载官方文档ocr_datasets) 1. 文本检测 1.1 PaddleOCR 文字检测数据格式1.2 公开数据集 1.2.1 ICDAR 2015 2. 文本识别 2.1 PaddleOCR 文字识别数据格式2.2 公开数据集 2.1 ICDAR 2015 …

使用Spring Security实现用户-角色-资源的权限控制

文章目录 一、基于角色的请求控制二、加载用户角色信息三、角色与资源的关联四、测试角色权限控制1. 未登录用户访问受保护资源2. 登录用户访问受保护资源3. 角色不足的用户访问受保护资源(把前面改成.roles("USER")) 五、自定义异常处理1. 自…

CANoe的数据回放功能

文章目录 CANoe简介1.Offline回放功能2.Replay Block回放模块3.两者的异同 CANoe简介 CANoe(CAN open environment): 用于汽车ECU网络仿真、数据分析、测试和诊断,还可以进行数据回放、程序刷写等。具有实时报文跟踪、数据解析及…

Android开发启动页跳过倒计时效果

Android开发启动页跳过倒计时效果 app启动页都会放些广告图,然后倒计时跳过。 一、思路: 不是很难,就用用个倒计时控制mHandler.sendEmptyMessageDelayed(WHAT_COUNT_DOWN, 100); 二、效果图: 三、关键代码: publ…