Deep research深度研究:ChatGPT/ Gemini/ Perplexity/ Grok哪家最强?(实测对比分析)

news2025/3/13 19:44:03

目前推出深度研究和深度检索的AI大模型有四家:
OpenAI和Gemini 的deep research,以及Perplexity 和Grok的deep search,都能生成带参考文献引用的主题报告。

致力于“几分钟之内生成一份完整的主题调研报告,解决人力几小时甚至几天的工作量。大大提升研究效率。”           

本文娜姐会针对一个文献综述主题,来测试对比一下这四家的实际生成效果。           

首先,这几款工具技术参数和价格对比如下:    

图片

2 各家效果测试对比:           

下面娜姐以一篇综述主题“炎症相关脂肪因子与痴呆的研究进展”为例,详细对比一下各家的输出效果:           

我要求按照如下框架内容展开,并包含一个总结性表格:

1 炎症相关脂肪因子的具体分类;2 脂肪因子在神经炎症中的作用机制;3 脂肪因子与不同类型痴呆的关系;4 临床研究和动物实验的最新进展;5 潜在的治疗靶点及干预策略            

2.1 Perplexity:

为防止用中文对话,Perplexity查找的都是中文信息源,我强调要查找英文文献,并用中文撰写综述,Perplexity听懂了:           

图片

但是,对于不同脂肪因子与痴呆症的作用机制,并没有深入讨论,只列举了相关性:

图片

    

最后听话照做输出了总结性表格,只是内容总结的不够全面:

图片

总结一下:

Perplexity deep search的优点是生成带参考文献引文的报告。内容的准确度还可以(对比刚上线时候功能似乎有改进),但是不够全面,对于研究型主题来说,深度也不够。好在它末尾的“关联问题”很有启发性,你可以继续深挖,补全信息,比如继续让它深度思考机制问题:    

图片

           

2.2 Grok3 deep search:

虽然我强调了检索英文文献,但是最后用中文输出报告,但是Grok还是检索的中文信息源:    

图片

           

然后换成用英文提问,要求中文回复,这下可以了。

Grok的深度搜索检索了20篇学术文献,并汇总结果用中文呈现给我。对比Perplexity的文献大多来自Pubmed、Semantic Scholar,Grok的文献来源更学术和多样化:包括ScienceDirect、Wiley、Oxford Academic等学术出版机构。           

但是它的参考文献没有在报告中引用,不好确认相关性:

图片

    

Grok表格总结和Perplexity总结的主要脂肪因子种类一样,但其他类目不同。Perlexity比Grok的总结更符合学术论文风格:

图片

           

2.3 Gemini deep research:           

Gemini和OpenAI的深度研究都是智能体驱动的,Gemini的底层模型是1.5 pro,在输出报告之前,都会先出一个内容框架,和你对齐需求,最终生成一份带参考文献来源的3000多字综述报告。 

图片

      

图片

脂肪因子和痴呆的作用机制探讨,Gemini比Perplexity和Grok深入一点,但是对于学术论文的文献综述,还太浅了:

图片

表格总结方面,Gemini总结的是所有炎症相关脂肪因子,而不是和痴呆相关的,对主题的理解有偏差:               

图片

           

2.4 OpenAI deep research:

用时7分钟,调研了35篇文献后,deep research给我输出了一份2万多字的完整综述:    

图片

     

图片

图片

毫无疑问,这份报告的质量是最高的,不是因为字数最多,而是它的报告足够有深度、准确性高、文献是最新的。      

表格总结,OpenAI deep research是最全面准确和最有深度的,并且全部带有引文链接:               

图片

    

图片

相比之下,Perplexity和Grok deep search脂肪因子总结不够全面,且分析较浅;Gemini Deep Research总结更全面,但是准确度有待核实,有一些不相关的脂肪因子总结进来。且表格其他项目没有OpenAI总结深入。           

总结一下:

Perplexity和Grok的深度搜索工具重在搜索和汇总信息,两者结果呈现相当。Groq搜索来源更广泛,但是文中不带引文,不好核实来源;Perplexity会在文中和文末同时附带参考文献。           

Gemini和OpenAI的深度研究相比,Gemini虽然背靠谷歌搜索,但是由于底层大模型1.5 pro不够给力,充其量只能算deep search的升级版,因为一份深度的研究报告除了对信息的检索,还包括对信息的判断、分析和汇总。               

OpenAI deep research胜在其底层模型o3,专门针对深度研究的使用场景,采用 “端到端的强化训练”方法,获得了很好的效果。    

3 OpenAI deep research特点分析      

该智能体从用户的问题出发,直接学习每一步该怎么办:例如应该搜索什么关键词、点击哪个链接、在页面中寻找哪些信息、何时结束搜索开始撰写报告等等。整个决策链条都是通过强化学习一体化学得的。           

不需要人为告诉它该搜索什么关键词、点击哪个链接、在页面中寻找哪些信息、什么时候结束搜索开始撰写报告等等 。    

图片

     (OpenAI deep research自主创建关键词,检索、分析、汇总信息的过程)      

正因为o3模型在信息判断和分析综合能力的提升,它特别适合学术类文献综述任务。           

当然,正如娜姐之前那篇关于OpenAI deep research文章的总结,它也不是没有缺点的: 

OpenAI deep research全面开放:如何更好的用它进行文献综述?(深度使用经验分享)

              

1 完成一个任务要多次尝试,速度慢,deep research完成一份报告要5-30分钟;且需要较高的算力支持(所以收费贵,plus用户每月才10次)。 

2 在文献来源方面,存在单篇文献过度引用和引用不全面的问题。在阐述某一个观点时,找到契合观点的文献可能一整段都会只引用1-2篇文献。所以,deep research出的报告一般都是20-30篇参考文献。即使你要求更多,也不会超出50篇。           

你看它的智能体运行过程,会发现,它在找到某一个观点的支撑文献之后,就会进入下一个任务,并不会就这个关键词继续全面检索文献。         

但是,不同于Gemini的一次性深度研究报告,OpenAI的deep research可以在同一个对话框继续对话,你可以针对报告中的某一个主题继续拓展,还能添加附件资料让它学习。           

图片

    

图片

4 学员群提问关于deep research的问题汇总:           

4.1 怎么样算是调用了deep research,我的是不是被降智了?

Deep research的回复分为两步,第一步对齐需求,第二步开始研究。进度条开启就是成功调用deep research,就会算一次(plus每月10次额度),最后生成的报告一定是带参考文献引用的。           

如果没有分两步进行,直接在第一次就回答了你的问题,且没有进度条展示和参考文献。那就是被降智了。概率问题,无解。           

4.2 该如何选择运行deep research的大模型?               

现在ChatGPT也有五六款模型可以选择了,用哪一个模型进行深度研究效果最好呢?

deep research的回答分为两步:第一步是根据你的提问和你对其需求,这一步可以自由选择模型,默认是4o,还可以选择其他推理模型o1;第二步是启动深度分析,这一步是调用专门训练用于深度研究的o3来完成的,选其他的也没用。   

4.3 报告怎么下载?

不同于Gemini的deep research,可以直接生成谷歌文档,以附件形式下载。OpenAI的深度研究报告不能以附件形式下载,只能在报告末尾左下角点“复制”按钮,复制到word文档查看。

图片

           

并且,参考文献都是附在文中,链接有时候还不能跳转。好在,有标题信息,都能溯源。               

好了,以上就是近期四款主流的AI大模型ChatGPT/ Gemini/ Perplexity/ Grok的深度搜索和深度研究功能对比。我们可以根据场景和自己的需求选择不同的深度研究工具,提升科研效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2314462.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于sqlalchemy的ORM的使用

关于sqlalchemy的ORM的使用 二、创建表三、使用数据表、查询记录三、批量插入数据四、关于with...as...:的使用 二、创建表 使用Mapped来映射字段 from sqlalchemy.ext.declarative import declarative_base from sqlalchemy.orm import sessionmaker,Mapped,mapped_columnBa…

【leetcode hot 100 148】排序序列

解法一:(双重循环)第一个循环head,逐步将head的node加入有序列表;第二个循环在有序列表中找到合适的位置,插入node。 /*** Definition for singly-linked list.* public class ListNode {* int val;* …

【Linux】在VMWare中安装Ubuntu操作系统(2025最新_Ubuntu 24.04.2)#VMware安装Ubuntu实战分享#

今天田辛老师为大家带来一篇关于在VMWare虚拟机上安装Ubuntu系统的详细教程。无论是学习、开发还是测试,虚拟机都是一个非常实用的工具,它允许我们在同一台物理机上运行多个操作系统。Ubuntu作为一款开源、免费且用户友好的Linux发行版,深受广…

AutoGen学习笔记系列(十三)Advanced - Logging

这篇文章瞄的是AutoGen官方教学文档 Advanced 章节中的 Logging 篇章,介绍了怎样在使用过程中添加日志信息,其实就是使用了python自带的日志库 logging。 官网链接:https://microsoft.github.io/autogen/stable/user-guide/agentchat-user-g…

scrcpy pc机远程 无线 控制android app 查看调试log

背景: 公司的安卓机,是那种大屏幕的连接usb外设的。不好挪动,占地方,不能直接连接pc机上的android stduio来调试。 所以从网上找了一个python adb.exe控制器,可以局域网内远程控制开发的app,并在android stduio上看…

UE5.5 Niagara发射器更新属性

发射器属性 在 Niagara 里,Emitter 负责控制粒子生成的规则和行为。不同的 Emitter 属性决定了如何发射粒子、粒子如何模拟、计算方式等。 发射器 本地空间(Local Space) 控制粒子是否跟随发射器(Emitter)移动。 ✅…

MongoDB备份与还原

备份恢复工具介绍 1)mongoexport/mongoimport 2)mongodump/mongorestore 备份工具区别 mongoexport/mongoimport 导入/导出的是JSON格式或者CSV格式 mongodump/mongorestore 导入/导出的是BSON格式。二进制方式,速度快 1)…

计算机:基于深度学习的Web应用安全漏洞检测与扫描

目录 前言 课题背景和意义 实现技术思路 一、算法理论基础 1.1 网络爬虫 1.2 漏洞检测 二、 数据集 三、实验及结果分析 3.1 实验环境搭建 3.2 模型训练 最后 前言 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,…

Java 大视界 -- Java 大数据在智能安防视频摘要与检索技术中的应用(128)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

部署项目至服务器:响应时间太长,无法访问此页面?

在我们部署项目到服务器上的时候,一顿操作猛如虎,打开页面..... 这里记录一下这种情况是怎么回事。一般就是服务器上的安全组没有放行端口。 因为我是用宝塔进行项目部署的。所以遇到这种情况,要去操作两边(宝塔and服务器所属平台…

【数据结构】List介绍

目录 1. 什么是List 2. 常见接口介绍 3. List的使用 1. 什么是List 在集合框架中,List是一个接口,继承自Collection。此时extends意为拓展 Collection也是一个接口,该接口中规范了后序容器中常用的一些方法,具体如下所示&…

vs2022用git插件重置--删除更改(--hard)后恢复删除的内容

1、先到项目工程中打开需要恢复的分支。 2、进入代码管理根目录文件夹。 3、在根目录文件夹点右键,点git bash here 正常情况下如果git目录权限足够,是可以如上图所示显示当前分支和当前目录的。 在git权限不足的情况下会出现如下提示: …

vscode接入DeepSeek 免费送2000 万 Tokens 解决DeepSeek无法充值问题

1. 在vscode中安装插件 Cline 2.打开硅基流动官网 3. 注册并登陆,邀请码 WpcqcXMs 4.登录后新建秘钥 5. 在vscode中配置cline (1) API Provider 选择 OpenAI Compatible ; (2) Base URL设置为 https://api.siliconflow.cn](https://api.siliconfl…

【MySQL】用户管理和权限

欢迎拜访:雾里看山-CSDN博客 本篇主题:【MySQL】用户管理和权限 发布时间:2025.3.12 隶属专栏:MySQL 目录 引言用户用户信息创建用户语法案例 修改用户密码语法案例 删除用户语法案例 权限权限列表查看和刷新用户的权限给用户授权…

指令微调 (Instruction Tuning) 与 Prompt 工程

引言 预训练语言模型 (PLMs) 在通用语言能力方面展现出强大的潜力。然而,如何有效地引导 PLMs 遵循人类指令, 并输出符合人类意图的响应, 成为释放 PLMs 价值的关键挑战。 指令微调 (Instruction Tuning) 和 Prompt 工程 (Prompt Engineerin…

UE5.5 Niagara 发射器粒子更新模块

Particle State (粒子状态)模块 Particle State 主要用于控制粒子的生存状态,包括死亡、消失、响应事件等。 Particle State Kill Particles When Lifetime Has Elapsed 当粒子的生命周期结束时,销毁这些粒子。 Lifetime &…

机器学习(吴恩达)

一, 机器学习 机器学习定义: 计算机能够在没有明确的编程情况下学习 特征: 特征是描述样本的属性或变量,是模型用来学习和预测的基础。如: 房屋面积, 地理位置 标签: 监督学习中需要预测的目标变量,是模型的输出目标。如: 房屋价格 样本: 如: {面积100㎡…

Django与视图

我叫补三补四,很高兴见到大家,欢迎一起学习交流和进步 今天来讲一讲视图 在web应用的MVC结构中,视图一般包含模板和表单,用来给浏览器生成响应。在实际处理过程当中,视图会根据请求的参数从数据源当中找到数据&#xf…

RabbitMQ从入门到实战-2

文章目录 Java客户端快速入门WorkQueue(多消费)能者多劳配置 交换机fanout交换机案例 Direct交换机Topic交互机 声明队列和交互机(IDEA中)基于Bean声明队列和交换机基于注解声明(推) 消息转换器配置Json消息转换器 业务改造&#…

Mac 配置 Maven JDK

不使用 Homebrew,创建指定版本 JDK 1、官网下载指定版本并安装……省略 2、vi ~/.zshrc 同时要检查 bash_profile 是否存在。 if [ -f ~/.bash_profile ] ; thensource ~/.bash_profile fiJAVA_HOME_11/Library/Java/JavaVirtualMachines/jdk-11.0.1…