AI文献阅读ChatDOC 、ChatPDF 哪个好?

news2025/1/2 14:19:55

作为AI产品的深度使用者,基本每天都在使用AI。AI诞生后仿佛给所有的产品打开了新世界大门。当然AI在文献阅读方面自然也不会缺席。

 

6d6165e5b32c8fcdbaf1b647386520cb.png

先来简单对比一下ChatDOC vs ChatPDF

 

36dd0f2585c0d027cd541b091c94bbe3.png

从表格里可以看到ChatDOC与ChatPDF都是基于GPT的产品,但在功能上ChatDOC还是比ChatPDF功能强大的多

  • 文件格式

在对文件格式的支持,ChatDOC支持PDF/DOC/markdown/txt/OCR/epub/website多种格式而ChatPDF只支持PDF文件。

  • AI模型

ChatDOC除了默认gpt-3.5-turbo外,还可以通过付费支持gpt-4o。如果你不想使用这些,在控制台还可以配置自己的AI模型。而从ChatPDF官网能查询到的它使用的是gpt-3.5的版本,并没有发现对gpt-4o的支持说明。

  • 语言支持

ChatDOC与ChatPDF官网的平台都可以发现是对多语言的支持,ChatPDF官网“全球通用!ChatPDF接受任何语言的PDF,并可以用任何语言聊天。”而ChatDOC语言下拉可以选择10几种语言,从这方面来说ChatPDF对多语言的支持能力是比ChatDOC强大的。

  • 图像和表格

ChatDOC官网有说明通过OCR可以解析文件中的图像并与之对话。而ChatPDF尚无法读取PDF中的图像,包括由扫描文本组成的图像。ChatPDF读取表格中的文本,但它可能在关联正确的行和列时遇到问题。在这方面ChatDOC要强一些。

 

 

下面我们就具体来使用一下ChatDOC与ChatPDF:

ChatDOC

 

668ec12bb895f4fe8a64fc65fb8bf41c.png

ChatDOC之前也有看到不少文章对它的介绍,都是比较推荐使用的,号称“最好的PDF AI Chat”,这里就来测试一下。

 

5eaa0188e8c01e7738df333d284545e1.png

生成文件摘要

上传一个文件,然后点击左上角工具栏中的“摘要”按钮或输出生成摘要,就可以从非常长文件中生成关键点和见解的摘要。只需几秒钟,就可以从文件中提炼出一个简明的摘要。

 

9df0df0ec87ad63b378b42261eca1dcd.png

从多个文件中提取见解

通过上传文件夹的方式,在多个长篇的文件中进行沟通对话,提取重点和关键发现。

 

ddc318dcaadc5fcb8247059e059da672.png

内容定位能力

要求AI从文件中检索详细内容。例如

在文件中“在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时,一定要注意当 value为 null 时会抛 NPE 异常”这条规范中举的例子中pairArrayList列表增加的第一个变量version1的值是多少?并指出你的依据在文件中的位置。

 

5242306a106c6423d8de26172c90b696.png

可以看到,这种定位能力并不是单纯的类似查找的功能,ChatDOC理解了我们的问题,并也能理解文件中的内容、代码或公式表达的意思。从而得出相应正确的回答,同时还能给出ChatDOC依据在文件中的出处。

 

强大的翻译能力

无论文件原始是什么语言都能进行语言的切换,用你熟悉的语言进行聊天,ChatDOC具有强大的翻译能力。

 

298962d94e052ef7d35b3da8d2b82d85.png

选择特定内容询问

我们可以选择特定的表格/文本/公式,要求ChatDOC用简单的术语解释它。

 

18f142f7f0e000b2af717879e6247dc5.png

 

ChatPDF

 

7b5e02dae9029173d6ca78c33a5d5d22.png

网站主页:直接上传PDF文件。

 

5fb2054b7155c3f516a8769ac1d9853a.png

上传后左边是文件列表,中间是上传的PDF预览图,右边会出来文件的主要内容,及参考的问题,选中后会出现功能菜单(解释、总结、改写)。

生成文件摘要

这里的总结也类似生成文件摘要的功能,我们来看看

 

f8e3496a1def940535dc681fd42359df.png

基本和其它AI一样都能大致提取并总结文件。

ChatPDF的总结没有像copilot那样进行总结分类,看着没那么精简。

提问+定位能力

 

16b88aef2ee4c86418eedd939a456e0c.png

ChatPDF也能正确的理解文字、代码或公式的意思,快速定位内容及找出答案

翻译能力

这是一份《Attention Is All You Need》的英文论文

 

c00169851deddf9f57388b6f20f8b1f7.png

让AI提炼PDF文件中的主要内容,并与AI对话,提相应的问题。

 

8e01c2407497a187a2d9c26a313d3c9d.png

可以看到中文问题给出来中文回答,这些AI产品基本都带有强大的翻译能力。

 

f3a96bd25e0a43549f3bdabae6cb14c8.png

上图是Leaderboard显示的ChatPDF每天的访问量。

总体来说还是不错的,从功能、使用界面及文件定位等方面。不足就是每天只能免费上传2个文件

 

3509eb3916249159a9101ec6530d93be.png

 

 

Copilot

Copilot也就是之前的new bing,可以看到微软的edge浏览器自带了Copilot插件,在浏览器的右上角的copilot logo。打开pdf文件后,点击copilot logo就会显示相应的功能项:

  • 生成文件摘要
  • 请提出关于这份文件的问题
  • 从此文件生成关键见解

生成文件摘要

 

bef064ad083f506b1dd38b33024f6ea5.png

手册简介:《Java 开发手册》是阿里巴巴和开课吧技术团队的经验总结,经过实战检验并不断完善。最新版本为黄山版,涵盖了编程规约、异常日志、单元测试等七个维度。

编程规约:手册提供了详细的编程规约,包括命名风格、代码格式、OOP 规约等,旨在提高代码质量和协作效率。

规约分类:规约分为【强制】、【推荐】、【参考】三类,以不同的约束力度指导开发者。

附加资源:手册配套有 IDE 插件和《码出高效》图书,提供了更多编程知识和实践经验。手册和图书的收入均捐赠公益事情。

摘要的简单,但又把文件中所有的内容都有提到。

这时你会想,我想了解更具体点的摘要,不要担心,copilot也有考虑到。

你可以点击“显示更多摘要”会进一步出来。

提问+定位能力

copilot不支持上传图片以外的文件,但可以通过edge浏览器打开,再使用copilot插件与文件对话

 

d9a8c92aed64ad5d91c8cdc94c5efd84.png

相同的问题,既然没找出来。

换个问题,是可以找出来的

文件中“浮点数类型的数值后缀统一为大写的 D 或 F”这条约定中,作者使用的例子中变量WEIGHT的数值是多少?并指出数值在文档的出处?

 

279994cb4533c880e92231bac6ea9f19.png

当然copilot是可以完全免费使用,它是包括文本语言、搜索引擎、绘画、翻译、阅读、编码等综合型AI产品。

 

2435638f1a3181d326832c67d974b190.png

当然像chatgpt、kimi等等这些不支持预览文件的AI,也可以通过上传文件的方式来实现对文件内容的解读。

在这个信息爆炸的时代,高效获取和处理知识真的太重要了。可以看到AI在帮我们阅读文献方面真的特别给力。想想那些500甚至上千页的PDF文件,以前看一眼就头疼,现在有了AI,根本不用一页一页地啃了。

 

 

其它AI阅读工具

司马阅SmartRead

司马阅SmartRead是一款国内的AI文件阅读工具,提供智能阅读、AI摘要、AI问答等服务。

 

b68fc568251eb3cc2d8a30cf3d85b263.png

讯飞星火知识库文件问答

讯飞星火知识库文件问答提供Al分析、阅读、问答工具,让大模型助你高效了解文件内容。

用户可以免费使用,可以对我的问题分析和定位到文件出处。

 

6318caaf2497e2b1aabb68f8d49282d8.png

WPS AI

PDF AI 支持总结长文信息、追溯原文、外文翻译提炼等文章处理任务,助你轻松高效阅读 PDF科研论文、报告、产品手册、法律合同、书籍等文件。

 

290a83f2b36bffb2eb79e75c02c49fc9.png

总结

可以看到不少统计网站,它们收集了全球出现的AI产品,从这些网站大概可以了解的目前全球已经出现1.5w+的AI产品,其中中国也已经超1000+。短短的1年多AI产品如雨后春笋般大量出现。AI已经覆盖了很多类别,包括聊天、绘图、阅读、写作、翻译等等。

 

462810648edca943be7410a59d8f2b07.png

 

 

8fb69a18eb2352e91fe26528856f1cf2.png

在AI辅助阅读工具这块我们可以发现它们具有共同的特征:

  • 摘要总结:能够生成文件的摘要。
  • 智能问答:用户可以向工具提问、聊天。
  • 多语言支持:支持多语言翻译能力。

 

  • 国外花钱

可以选择chatgpt-4:gpt是综合性AI产品,集文本语言、搜索、绘画、翻译、阅读、编码以一身的综合型AI产品。

  • 国内不花钱

专注于文献的可以选择司马阅SmartRead试试,当然kimi是综合性AI产品,虽然没有文档预览效果的,但功能也非常强大。

  • 国内花钱

如果只可以选择专注于文献ChatDOC。

对于需要使用要非常简单好用的人来说花点钱或许是更好的选择,这类AI会更专注某个领域的功能。

对于一些技术人员来说,不想花钱就可以选择new bing、kimi这类的免费的综合性AI产品。

 

 

我是栈江湖,如果你喜欢此文章,不要忘记点赞+关注

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2268104.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小程序基础 —— 10 如何调试小程序代码

如何调试小程序代码 在进行项目开发的时候,不可避免需要进行调试,那么如何调试小程序呢? 打开微信开发者工具后,有一个模拟器,通过模拟器能够实时预览自己写的页面,如下: 在上部工具栏中有一个…

vue+echarts实现疫情折线图

效果&#xff1a; 代码&#xff1a; <<template><div><div id"left1" style "height:800px;width:100%"></div></div> </template><script> //疫情数据//export default {data() {return {data:{//疫情数据…

使用arduino从零做一辆ROS2Jazzy的阿克曼小车---电机驱动篇

本项目采用 Arduino Mega2560 Pro 作为主控开发板&#xff0c;电机驱动器选用 TB6612FNG&#xff0c;并配备了 12V 电源、两个直流减速电机和一个舵机。未来计划通过嘉立创将各模块集成到一个 PCB 板上&#xff0c;提升系统的集成度和稳定性。 本文将聚焦于电机驱动部分&#x…

基于源码剖析:深度解读JVM底层运行机制

每日禅语 佛说&#xff0c;给你修路的&#xff0c;是你自己&#xff1b;埋葬你的&#xff0c;也是你自己&#xff1b;帮助你的&#xff0c;是你自己&#xff1b;毁灭你的&#xff0c;也是你自己&#xff1b;成就你的&#xff0c;自然还是你自己。所以佛说&#xff1a;自作自受&…

算法进阶:贪心算法

贪心算法是一种简单而直观的算法思想&#xff0c;它在每一步选择中都采取在当前状态下最优的选择&#xff0c;以期望最终得到全局最优解。贪心算法通常适用于一些具有最优子结构的问题&#xff0c;即问题的最优解可以通过一系列局部最优解的选择得到。 贪心算法的基本思路是&a…

Hive刷分区MSCK

一、MSCK刷分区 我们平时通常是通过alter table add partition方式增加Hive的分区的&#xff0c;但有时候会通过HDFS put/cp命令或flink、flum程序往表目录下拷贝分区目录&#xff0c;如果目录多&#xff0c;需要执行多条alter语句&#xff0c;非常麻烦。Hive提供了一个"…

Windows API Set:那些“只存在但不被使用“的DLL

API Set 是什么&#xff1f; 想象一下&#xff0c;Windows就像一个大型图书馆&#xff0c;而API Set就是这个图书馆的索引系统。但这个索引系统非常特别&#xff1a;它是直接内置在Windows加载器中的"虚拟目录"。 // 一个典型的API Set映射示例 api-ms-win-core-mem…

【Java 数据结构】合并两个有序链表

&#x1f525;博客主页&#x1f525;&#xff1a;【 坊钰_CSDN博客 】 欢迎各位点赞&#x1f44d;评论✍收藏⭐ 目录 1. 题目 2. 解析 3. 代码实现 4. 小结 1. 题目 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示…

图像处理-Ch6-彩色图像处理

Ch6 彩色图像处理 无广告更易阅读&#xff0c;个人博客点此进入<– 文章目录 Ch6 彩色图像处理彩色基础彩色模型(Color models)RGB(red, green, blue)CMY & CMYK(cyan, magenta, yellow/and black)HSI(hue, saturation, intensity)HSV(hue, saturation, value) 颜色空…

03.HTTPS的实现原理-HTTPS的工作流程

03.HTTPS的实现原理-HTTPS的工作流程 简介1. HTTPS的工作流程1.1. TCP的工作流程1.1.1. 三次握手的详细步骤1.1.2. 三次握手的作用 1.2. HTTPS的工作流程1.2.1. HTTPS与TCP的关系1.2.2. HTTPS的工作流程 2. 公钥和私钥的作用3. 对称密钥的生成和交换4. 对称加密和非对称加密的区…

隧道FM广播信号、隧道内调频广播信号覆盖方案选择

一、为什么汽车驶入隧道内&#xff0c;就听不到FM调频广播信号了 隧道是一个半封闭的管状结构&#xff0c;有很强的电磁屏蔽效应&#xff0c;汽车进入隧道后&#xff0c;汽车收音机就会出现沙沙的噪声&#xff0c;这是由于隧道内的调频广播信号变弱甚至无信号&#xff0c;导致车…

基于SSM的“电器网上订购系统”的设计与实现(源码+数据库+文档+PPT)

基于SSM的“电器网上订购系统”的设计与实现&#xff08;源码数据库文档PPT) 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SSM 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 系统首页 商品类型 商品管理 订单展示 商品购物车 登录页面 …

工业大数据分析算法实战-day19

day19 今天是第19天&#xff0c;昨日是针对线性规划、整数规划建模技巧进行阐述&#xff0c;今天开启第九章节—行业知识沉淀的方法&#xff0c;该章节主要是对行业知识的范畴进行探讨&#xff0c;将讨论限制在研判类的知识沉淀上&#xff0c;将业务范围侧重在PHM中&#xff0…

Unity URP多光源支持,多光源阴影投射,多光源阴影接收(优化版)

目录 前言&#xff1a; 一、属性 二、SubShader 三、ForwardLitPass 定义Tags 声明变体 声明变量 定义结构体 顶点Shader 片元Shader 四、全代码 四、添加官方的LitShader代码 五、全代码 六、效果图 七、结语 前言&#xff1a; 哈喽啊&#xff0c;我又来啦。这…

8086汇编(16位汇编)学习笔记09.宏汇编

8086汇编(16位汇编)学习笔记09.宏汇编-C/C基础-断点社区-专业的老牌游戏安全技术交流社区 - BpSend.net 宏汇编在文件中是当做关键字的,但是在bug中运行时并没有这些指令,这些关键词被称为伪指令,cpu并不认识他们,需要经过编译器转化成 cpu认识的代码,但是他多我们写代码帮助又…

leetcode 面试经典 150 题:矩阵置零

链接矩阵置零题序号73题型二维数组解题方法标记数组法难度中等熟练度✅✅✅✅ 题目 给定一个 m x n 的矩阵&#xff0c;如果一个元素为 0 &#xff0c;则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例 1&#xff1a; 输入&#xff1a;matrix [[1,1,1],[1,0,1]…

五、CentOS7/CentOS8安装APISIX(1)

目录 &#x1f33b;&#x1f33b; 一、 Apache APISIX介绍1.1 什么是Apache APISIX1.2 APISIX架构1.3 Apache APISIX 的技术优势1.4 APISIX‌应用场景 二、APISIX快速开始2.1 centos7/centos8安装APISIX 一、 Apache APISIX介绍 1.1 什么是Apache APISIX Apache APISIX 是一个…

BUG分析 - 重启有时失败

1. 倒查版本 1.0_11 - ok1.0_12 - fail 2.对比1.0_11和1.0_12 失败时的日志 ================================== 1.0_11 ============================== 2024-12-26 09:46:51.886 INFO [26332] [ThreadPLCPool::in

Ngnix介绍、安装、实战及用法!!!

一、Nginx简介 1、Nginx概述 Nginx (“engine x”) 是一个高性能的 HTTP 和 反向代理服务器&#xff0c;特点是占有内存少&#xff0c;并发能力强&#xff0c;能经受高负载的考验,有报告表明能支持高达 50,000 个并发连接数 。 2、正向代理 正向代理&#xff1a;如果把局…

【物联网】给EoRa Pi 烧录Meshtastic

文章目录 一、Meshtastic 是什么&#xff1f;二、Meshtastic 烧录过程1. 在线烧录工具2. 刷机进度 总结 一、Meshtastic 是什么&#xff1f; Meshtastic 是一种基于 LoRa 技术的离网通信平台。它通过低成本、低功耗的无线电设备&#xff0c;实现远距离自组网通信。可在脱离现有…