大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
推理者(Reasoners),位于OpenAI提出的从AI到AGI五级分类系统中的第二阶段。推理者与基础AI(Emerging AGI)——当前大多数AI系统——的一大区别在于其推理能力以及复杂问题的解决能力。推理AI不依赖外部信息源来获取答案,而是通过已有的知识及内部推理来解决复杂问题。这一点是不是和我们人类的认知-学习-应用一样,先学习现有知识,然后根据这些知识基础来构建推理链条从而应用到现实问题上。
OpenAI不久前发布的推理模型o1
让所有人看到了AI模型进化的另一个方向。作为一款AI模型,它的知识水平和推理能力与博士级别相当,更是在国际数学奥林匹克(IMO)考试中达到了惊人的83%正确率,其“智商”可见一斑。
国内的AI厂商摩拳擦掌,纷纷跟进,以Kimi和智谱为首,推出了类似的推理型AI产品。本篇文章的主角就是由月之暗面于10月11日正式推出的推理AI搜索产品:Kimi探索版。
Kimi探索版是什么?简单来说,Kimi探索版是一款融合了类似o1
模型的推理功能(内部思维链)的AI搜索工具。本质上它是一个AI搜索工具,一款产品,而非一个AI模型。这个AI搜索工具和AI Agent一样,拥有推理(Reasoning)、规划(Planning)、工具调用(Tool Use)和反馈(Reflection)的能力。
-
推理(Reasoning)和规划(Planning):推理规划是我们人类解决复杂问题的第一步,AI也是如此。面对一个复杂问题,我们通常先对问题进行全面分析,拆解为多个子问题,然后规划出解决路径。这种思维方式被称作“思维链(Chain of Thought)”。OpenAI的
o1
模型为什么有如此强大的推理能力,就是因为其内部思维链。 -
工具调用(Tool Use):LLM模型本身不具备第三方工具调用的能力,如联网搜索,但AI Agent(智能体)可以。Kimi探索版就像是这么一个AI Agent,它拥有调用外部工具的能力,如Web搜索引擎,这样使得模型能够处理其自身能力范围之外的任务。
-
反馈(Reflection):反馈是AI Agent设计中的一种重要方式:通过自我反思和迭代改进来提高AI模型对于复杂任务执行能力。根据月之暗面官方的介绍,Kimi探索版在AI搜索的最后一步也拥有反馈和自我修正的能力:对生成的结果进行反思,检查信息是否存在遗漏或错误,并在必要时补充或修改答案。这其实不难理解,因为Kimi探索版其实就是一个伪装的AI Agent。
为什么需要Kimi探索版?主要原因之一就是当前大多数AI搜索工具都还停留在初级搜索阶段。何为初级搜索阶段?就是虽然能够提供较为全面的信息检索,但依然局限于关键词匹配与基础的文本分析。综合来看,只能满足简单的信息搜索需求,比如查询天气,查询百科知识,查询历史事件等。而面对复杂问题时,传统的AI搜索工具很容易陷入信息拼凑的局限,给出的结果往往信息量大但实用性低,用户还需自行从冗长的结果中筛选有用的信息。比如旅行规划,得到的结果往往是搜索信息的简单拼凑,答案缺乏深度推理思考。
Kimi探索版可以算是AI搜索PLUS,加入了推理能力的增强型AI搜索工具。这算是推理模型/能力在AI搜索方向一个非常好的尝试和应用了。
附上Kimi探索版产品负责人很自信的说法:“如果Kimi搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。”
如何体验Kimi探索版
https://kimi.moonshot.cn/
目前Kimi探索版只支持Web网页端,手机App端暂时没有上线该功能。并且,Kimi探索版作为一个高级功能,目前每人每天有着5次的使用限制。这个限制算是只能尝个鲜了。
按照上面的链接打开Kimi的网页,首页就可以看到Kimi探索版的推荐。共有两种方式进入探索版,一种是在输入框里输入斜杠字符:“/”,然后点击Enter回车键。
第二种进入Kimi探索版的方式是打开输入框左下角探索版
的开关,即可直接进入探索版。
Kimi探索版初体验
要想测试Kimi探索版,需要提问一个比较复杂的搜索问题。怎么算复杂?用传统的搜索引擎一步查询不到结果的都可以算作是复杂任务。比如下面这个。
如何应对2024年中国新能源汽车市场竞争加剧的趋势?各大厂商的战略是什么?
对于这个问题,传统的搜索引擎肯定是搞不定的,一来需要搜索的内容过多,二来不但需要搜索到内容,还需要对其进行整合、分析,最终得出答案。
Kimi探索版给出的答案是这样的。
点评
综合来看,信息检索的速度很快,符合Kimi官方对于这个新功能的描述。在几十秒阅读了127个网页。Kimi探索版给出的信息比较详尽且覆盖面广,共提供了12家主要新能源汽车厂商的战略概述,基本涵盖了所有国内外的领先企业。信息源的及时性和准确性也还可以,基本都是来自2024年的行业数据和新闻报道。
但从上面的回答也可以看出,虽然Kimi探索版是把检索到的海量信息进行了汇总整理,但缺乏深入的行业趋势分析,对于每一条战略分析的深度有待加强,目前看起来仅仅是对信息的堆砌,每个战略一句话就带过了。此外,虽然给出了各大厂商的战略,但不同厂商的策略之间的竞争性和差异性没有进行足够的对比分析。因此,在这个测试案例中,Kimi探索版的推理能力没有特别突出的表现。
结语
Kimi探索版,Kimi版的o1
,对AI搜索有要求的小伙伴可以体验起来了!
精选推荐
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。