这个大模型确实成功消除了我在论文阅读上的障碍

news2024/9/22 13:42:28

🐱 个人主页:TechCodeAI启航,公众号:TechCodeAI

🙋‍♂️ 作者简介:2020参加工作,专注于前端各领域技术,共同学习共同进步,一起加油呀!

💫 优质专栏:AI相关最新技术分享(目前在向AI方向发展,欢迎大佬交流)

📢 资料领取:前端进阶资料可以找我免费领取

🔥 摸鱼学习交流:我们的宗旨是在「工作中摸鱼,摸鱼中进步」,期待大佬一起来摸鱼!

就在今年的阳春三月,英伟达首席执行官黄仁勋独具匠心地组织了一场极为特别的活动。他满怀诚意地将开创性论文《Attention Is All You Need》的作者们召集到 GTC,深入热烈地交流探讨生成式 AI 的未来发展走向。

“我们所处的领域如今所拥有的一切成就皆可溯源至那一刻…… 你们重塑了整个世界……”黄仁勋在现场慷慨激昂地说道。

不管怎样,在今年 3 月的时候,英伟达 CEO 黄仁勋别出心裁地举行了这样一场活动。他积极邀请相关作者,共同探讨相关话题。黄仁勋在现场情绪饱满地讲出了上述话语。

图片

在科研引领方向的 AI 行业之中,下一次足以颠覆世界的契机,或许就隐匿于某一篇论文之内。

所以,在这个范畴当中,我们察觉到了一种非同寻常的情形:一部分并非具备技术背景的 CEO 们居然也开始挑灯夜战研读论文,企图以此降低决策时的试错代价。

CEO 们尚且这般,行业内的其他从业人员就更不必说了。就在不久前,OpenAI、谷歌、Meta 接连放出大招,一些创业公司也持续推出新的模型和新的方法,想必众多从业人员都会觉得论文数量繁多,根本应接不暇。

把论文交付给 AI 进行总结是当下普遍采用的阅读手段,然而很多由 AI 总结的内容欠缺明晰的层次,对于创新要点和局限性也缺乏详尽的阐述,我们往往需要经过好几轮的追问,才能够形成对论文完整的了解。并且,一些关键的模型架构图、实验结果图仍需自己到论文当中去寻觅,实际节省下来的时间着实相当有限。

在腾讯「元宝」的最新一轮更新当中,我们寻觅到了针对这些问题的化解之法。他们新推出的「深度阅读模式」支持对长篇文章的精细研读,能够给出模块化且图文并茂的剖析,极度适宜用于阅读论文。

总之,在 AI 行业里,改变的机会可能藏于论文。我们看到了相关现象和问题,好在腾讯「元宝」的更新带来了解决方案。

腾讯混元

,赞107

为了切实检验这一新功能所呈现的成效,机器之心展开了一番亲身的实际测试。

论文「精读」,精在哪儿?

运用 AI 来阅读论文究竟是何种感受?大多时候的情况是:当你给它递去一个 PDF 文件,它回馈给你的是一段总结以及若干条概述(有时甚至可能多达 10 条)。此类信息的确具备一定的助益,然而在某些时候,你很难清晰地辨别出哪些属于亮点,还有论文究竟解决了何种问题、未解决何种问题,有哪些核心的问题值得仔细探究。

我们通过实际测试察觉到,“元宝”是凭借提供一连串模块化、结构化的信息来处理这些难题的。

以我们所测试的一篇来自 SIGGRAPH 的论文作为示例。倘若你直接将论文投放进去,它所返回的总结与其他 AI 的差异并不显著。但是,只要你怀有耐心继续往下拉动,便能够看到一个“深度阅读该文档”的按钮,此乃“一键直通”论文精读的关键开关。

不管怎样,使用 AI 读论文的感受常常如此。我们实测了解到“元宝”的解决办法。就像测试的那篇论文,起初不明显,但关键按钮能开启精读。

图片

和以往用于总结论文的界面存在差异,精读页面能够将论文拆解得分外有条理,研究背景、研究方法、实验设计、结果分析以及总体结论,分别被整理成为一个独立的模块,这和机器之心平常介绍论文的结构极为相似。所有的这些内容,均能够通过左侧的大纲实现快速跳转。

不管怎么说,新的精读页面独具特色,对论文拆解清晰,类似常见的介绍方式,还能通过大纲便捷跳转。

图片

千万不要觉得每个模块的字数少,实际上这些文字蕴含的信息量极大。就拿研究背景这个模块来说,在“研究难点”段落,仅仅凭借三个短句就阐述了四个难点,而“相关工作”更是对第二章“related work”的极度凝练,区区一段话就将该领域的主要技术路线清晰地介绍到位。因此,在读完这个模块以后,我们大体上就能够明白论文所研究的究竟是何种问题,所面临的又是怎样的一种研究状况。

不仅是上述这些常规的结构化信息,元宝的精读还存在一个让人倍感惊艳的设计——它会把论文的优点和不足逐一罗列出来,有助于研究者迅速知晓自己能够从这篇论文当中获取到什么,还有哪些问题值得进一步深入研究。

不管怎样,元宝精读的这个独特设计,为研究者提供了极大的便利。

图片

图片

为何这个功能这般关键?中国台湾清华大学的教授彭明辉在有关论文阅读的一篇著述里曾经提及,论文与课本存在差异,课本会给予他人整理、组织好的系统性知识,然而论文需要读者自身从毫无组织的知识当中进行检索、筛选以及组织知识。其中,剖析既有研究的优点和缺点的能力尤为关键,这属于批判性思维的重要构成部分,也是在学术研究当中实现自我提升的重要渠道。元宝借助迅速分析并总结论文的优点和缺点,能够助力研究者节省大量用于筛选和初步理解的时间,让他们能够更为迅速地将注意力集中于和自身研究直接相关的论文上。

反正,这个功能在论文阅读中意义非凡,能带来诸多便利。

不过,倘若你认为前面的这些信息太过繁杂,你同样能够直接跳转至最后的“关键问题与解答”模块。在这里将会罗列几个最为关键的问题,使你能够迅速了解到论文的价值,从而判断是否值得花费时间去阅读原文。当然,此前的众多 AI 助手也会在答案的末尾展示一些关键问题,点击一下就能获取答案,可要是你是一名初涉此领域的新手或者具有跨学科背景的读者,你或许不太容易判断哪些问题更为关键。元宝这种直接呈现的方式给人的感觉要更加直观明了。

总归,元宝的这一模块设计,对于读者判断论文价值很有帮助。

图片

原图原数,谁说 AI 读论文不能配图?  

在阅读论文的过程中,不少人都存在这样一种习惯,那就是一边查看图表,一边阅览论文的相关描述。如此一来,理解的速度会更快,难度也会更低。然而,当下市面上的绝大多数 AI 应用所给出的大都是文字形式的结果,倘若想要看图,就不得不自己到原文当中去寻觅。
 

反正,这种现状给读者带来了不便。

举例来讲,如果在某个模块论述架构,那么它就会把与之对应的架构图展示出来:

图片

图片

如果在某个模块讲实验结果,那它会把对应的图表放上:

图片

图片

大家都清楚,大模型存在的幻觉问题至今仍无法彻底得到解决。所以,这种原汁原味呈现原图和原数据的方式实则是一种更为可靠的输出模式,便于读者随时对模型给出的答案加以验证,在当作参考时也更有保障。

这种呈现方式优势明显,值得肯定。

另外,经过我们的探索,还了解到,如果您有撰写博客之类的对外输出的需求,元宝能够为您绘制图表。并且您无需告知它数据的来源位置,它能够自行定位到论文里的相关表格,将数据提取出来并完成绘制。这一功能能够通过精读页面右侧的「提问」按钮予以激活。

不管怎样,元宝的这一功能为用户带来了很大的便利。

图片

随时随地想读就读,谁说读论文障碍重重?  

除开结构化的资讯以及图文兼具的输出成果,在我们展开的测试里,还惊喜地察觉到,元宝实际上具备一些极其实用的细微功能,能够让阅读论文这一行为变得愈发便捷。

首先要说的是划词翻译和搜索,这属于“原文”阅读界面的两个极为实用的细微功能。划词翻译能够为英语水平欠佳的读者随时随处清除语言方面的阻碍,而划词搜索则更进了一步,仿佛是将元宝的搜索功能打造成了一个插件,能够随时搜索相关的信息。并且,元宝所给出的解释并非只是简短的归纳总结,还存在模块化的拓展呈现,真正地将“结构化”、“富含信息量”融入到了每一个细微之处。

这些功能让元宝在处理论文阅读方面表现出色。

图片

图片

其次是“离线阅读”。此功能的妙处在于:能够使您在“飞行模式”下重温精读内容与原文,绝不浪费点滴碎片时间。这给航空公司在和高铁的竞争里增加了筹码。没准,研究者们的下一个灵感就出现在飞机上回看精读的时候。

图片

最后一个令人惊喜的小功能是「计算器」。就在前段时间,AI 因无法准确分辨 9.9 和 9.11 孰大孰小而引发了诸多讨论。在元宝中,我们惊喜地发现它整合了计算器功能,能够切实依据准确的计算结果来生成答案。这种功能在我们阅览实验数据时用处极大。

不得不说,这个功能为用户带来了极大的便利。

长文精读的背后:专家指导至关重要

依据官方消息,腾讯元宝此次的升级重点在于「长文精读」,能够原生支持最长近乎 50 万字的输入。我们在测试中所采用的论文远远未达此长度,日常接触的论文大多亦如此。故而使用元宝来精读论文,多数情况下上下文窗口都是充足的。它的模块化、图文并茂的输出,还有划词搜索、翻译等小功能,着实让阅读论文这件事变得便捷、高效,在“实用性”方面又迈进了一大步。

这种进步离不开其背后的模型——腾讯混元大模型的优化升级。据了解,为了于专业领域增强模型的专业性和实用性,腾讯混元团队特地邀请领域专家归纳各专业领域的核心技能,并制定了专业问题的回答规范,促使模型能够真正如同领域专家一般提供服务。正因如此,我们在使用过程中能够明显感觉到,元宝清楚论文读者所需的信息以及信息应当如何呈现。

可以说,腾讯混元团队的努力为元宝的出色表现奠定了坚实基础。

除了论文,这一全新功能还能够用于精读财报、研报等长文本。在这些场景中,它能够从多个维度梳理信息,依据报告内容生成杜邦分析图等专业图表,让对这些文件一窍不通的人也能够明白企业的财务状况等信息。

无论如何,腾讯元宝的这一功能为广大用户带来了实实在在的便利。

图片

然而,针对读论文这一场景而言,元宝的确还存在一定的可提升之处,像是在阅读原文的界面缺少完整的原文 - 译文对照,对公式的识别偶尔会不太精准等等。我们由衷期待元宝能够在后续的更新里完善这些问题。

不管怎样,元宝的未来发展值得我们持续关注。

但作为一款问世仅两个多月的应用,腾讯元宝的表现已然令人刮目相看。它的发展轨迹使我们得以预见,大模型将会怎样逐步转化为新的生产力。我们也满心盼望这个 APP 能够为我们创造更多的惊喜。

总之,我们对腾讯元宝充满了期待和信心。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2034447.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图像压缩算法

8.1 JPEG压缩 (JPEG Compression) 介绍 JPEG(Joint Photographic Experts Group)压缩是最常用的有损图像压缩算法之一。它通过减少图像中的冗余数据来实现高效压缩,特别适用于自然图像。 原理 JPEG压缩的基本步骤包括颜色空间转换、离散余…

偏导数的可视化

偏导数的可视化 flyfish 函数 f ( x , y ) sin ⁡ ( x ) ⋅ cos ⁡ ( y ) f(x, y) \sin(x) \cdot \cos(y) f(x,y)sin(x)⋅cos(y) import numpy as np from sympy import lambdify, sin, cos from sympy.abc import x, y import matplotlib.pyplot as plt from mpl_toolk…

【Ubuntu24.04搭建turn服务器】

1.安装与启动 首先安装coturn sudo apt-get update -y sudo apt-get install coturn -y可以看到默认的TURN服务是不启动的 # Uncomment it if you want to have the turnserver running as an automatic system service daemon # #TURNSERVER_ENABLED1编辑配置文件取消注释 …

【区块链+食品安全】湖南省食品行业联合会:溯链中国—基于区块链的食品安全可信追溯平台 | FISCO BCOS应用案例

食品安全追溯体系的建设,能够切实加强食品安全监管,确保人民群众饮食安全和身体健康,是创建食品安全城市必不可少的一部分。然而,中心化存储、信息孤岛、窜货是传统溯源行业最大痛点。区块链技术的快速发展, 使得防伪溯…

42.【C语言】冒泡排序

目录: 冒泡排序 *核心思想 *分析 *代码 *优化 15.冒泡排序(bubble sort) *核心思想:两两相邻的元素进行比较,满足条件则两者交换 *分析 现要求升序排序 输入: 9 8 7 6 5 4 3 2 1 0 输出:0 1 2 3 4 5 6 7 8 9 下面展示一趟冒泡排…

NLP从零开始------9文本进阶处理之文本相似度计算

1.文本相似度计算简介 在自然语言处理中,经常会涉及度量两个文本相似度的问题。在诸如对话系统和信息减速等中,度量句子或短语之间的相似度尤为重要。在新闻学传媒中应用文本相似度可以帮助读者快速检索到想要了解的报道。 文本相似度的定义式如下所示&a…

江协科技STM32学习笔记(第08章 USART串口)

第08章 USART串口 8.1 USART串口协议 8.1.1 通信接口 在STM32中,集成了很多用于通信的外设模块,比如下表所列。 通信的目的:将一个设备的数据传送到另一个设备,扩展硬件系统。 针对STM32内部没有的功能,比如蓝牙无…

04创建型设计模式——建造者模式

一、建造者模式简介 建造者模式(Builder Pattern)又被称为生成器模式。它旨在构建一个复杂对象的各个部分,而不需要指定该对象的具体类。该模式特别适用于对象的构建过程复杂且需要多个步骤的情况。建造者模式是一种对象创建型模式之一&…

【Mysql】mysql三种安装方式(二进制、yum、docker)

一、环境信息 centos7.6_x86、glib2.17 mysql官网下载地址:MySQL :: Download MySQL Community Server 二、 二进制安装 #下载解压安装包 [roothadoop03 ~]# wget -c https://cdn.mysql.com//Downloads/MySQL-8.0/mysql-8.0.39-linux-glibc2.17-x86_64.tar.xz [ro…

PX4二次开发快速入门

文章目录 前言一、概述二、二次开发基础(自定义工作队列,自定义uorb)三、自定义串口驱动(添加一个毫米波雷达并定高)四、自定义I2C驱动(驱动一个oled显示屏)五、自定义参数六、自定义日志七、自…

机器学习笔记:编码器与解码器

目录 介绍 组成结构 代码实现 编码器 解码器 合并编码器-解码器 思考 介绍 在机器翻译中,输入的序列与输出的序列经常是长度不相等的序列,此时,像自然语言处理这种直接使用循环神经网络或是门控循环单元的方法就行不通了。因此&#x…

Qt 窗口:菜单、工具与状态栏的应用

目录 引言: 1. 菜单栏 1.1 创建菜单栏 1.2 在菜单栏中添加菜单 1.3 创建菜单项 1.4 在菜单项之间添加分割线 1.5 综合示例 2.工具栏 2.1 创建工具栏 2.2 设置停靠位置 2.3 设置浮动属性 2.4 设置移动属性 3. 状态栏 3.1 状态栏的创建 3.2 在状态栏中显…

Pytorch_cuda版本的在线安装命令

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 运行效果如下: 这个方法是直接从pytorch官网进行在线下载和安装。 cu121,表示当前您安装的cuda版本是12.1

java基础概念15-字符串

public static void main(String[] args) {String name "张三";name "李四";System.out.println(name);// 李四} name变量是一个引用变量,它存储的是对字符串对象的引用(即内存地址),而不是字符串对象本身的…

【Git】远程仓库新建分支后,拉到本地开发

1. 在远程仓库上创建分支 2. git fetch origin:在本地同步远程仓库的分支(获取远程仓库所有分支的所有修改) 3. git remote -a:查看所有分支(远程+本地) 4. git checkout -b 本地名 远程仓库…

华夏erp2.3代码审计

1 sql注入代码 该项目使用的是Mybits的数据库,直接在*.xml文件中全局搜索 ${我们选一个比较有可能有注入的 UserMapperEx.xml 进行查 看 回溯到UserMapperEx.java。 继续回溯到UserService.java。 继续回溯可以看到UserComponent.java中userName的值是从search中获取的。 在s…

CodeWave--创建实体与枚举

一、实体的创建 可视化开发左侧边栏选择数据模块,在实体菜单下,选择2处的“” ,即可创建一个默认的实体类,修改3处的实体名称,再在实体页签中,添加所需的字段即可。 注:id是自动生成的主键&…

域名是什么?1分钟快速了解

任何一个互联网上的设备,包括服务器或我们的个人电脑设备,都有一个对应的地址,即IP地址,(比如,192.168.1.1)。所有设备,都通过这个独立唯一的IP地址来互相访问。 由于IP地址不容易被记忆&#…

仅需三步,轻松制作电脑系统安装盘!

系统安装在现在可谓是必不可少的技能。自己系统坏了,不用到电脑安装,省了不少大洋,在朋友面前也可以装装大神,百利无一害呀,还不赶快学起来! 按照以前常规方式,每个电脑系统都会配有一个光盘,然后放到光驱里面读取安装,但随着笔记本越做越薄,光驱慢慢被取消了。所以…

广州网站建设运营团队

广州是中国南部的一座国际化大都市,拥有众多创新科技企业和互联网公司。随着数字经济的快速发展,网站建设和运营已经成为企业发展和推广的重要手段。作为一支专业的网站建设运营团队,我们深知在这个信息化时代,拥有一个优质的网站…