🐱 个人主页:TechCodeAI启航,公众号:TechCodeAI
🙋♂️ 作者简介:2020参加工作,专注于前端各领域技术,共同学习共同进步,一起加油呀!
💫 优质专栏:AI相关最新技术分享(目前在向AI方向发展,欢迎大佬交流)
📢 资料领取:前端进阶资料可以找我免费领取
🔥 摸鱼学习交流:我们的宗旨是在「工作中摸鱼,摸鱼中进步」,期待大佬一起来摸鱼!
就在今年的阳春三月,英伟达首席执行官黄仁勋独具匠心地组织了一场极为特别的活动。他满怀诚意地将开创性论文《Attention Is All You Need》的作者们召集到 GTC,深入热烈地交流探讨生成式 AI 的未来发展走向。
“我们所处的领域如今所拥有的一切成就皆可溯源至那一刻…… 你们重塑了整个世界……”黄仁勋在现场慷慨激昂地说道。
不管怎样,在今年 3 月的时候,英伟达 CEO 黄仁勋别出心裁地举行了这样一场活动。他积极邀请相关作者,共同探讨相关话题。黄仁勋在现场情绪饱满地讲出了上述话语。
在科研引领方向的 AI 行业之中,下一次足以颠覆世界的契机,或许就隐匿于某一篇论文之内。
所以,在这个范畴当中,我们察觉到了一种非同寻常的情形:一部分并非具备技术背景的 CEO 们居然也开始挑灯夜战研读论文,企图以此降低决策时的试错代价。
CEO 们尚且这般,行业内的其他从业人员就更不必说了。就在不久前,OpenAI、谷歌、Meta 接连放出大招,一些创业公司也持续推出新的模型和新的方法,想必众多从业人员都会觉得论文数量繁多,根本应接不暇。
把论文交付给 AI 进行总结是当下普遍采用的阅读手段,然而很多由 AI 总结的内容欠缺明晰的层次,对于创新要点和局限性也缺乏详尽的阐述,我们往往需要经过好几轮的追问,才能够形成对论文完整的了解。并且,一些关键的模型架构图、实验结果图仍需自己到论文当中去寻觅,实际节省下来的时间着实相当有限。
在腾讯「元宝」的最新一轮更新当中,我们寻觅到了针对这些问题的化解之法。他们新推出的「深度阅读模式」支持对长篇文章的精细研读,能够给出模块化且图文并茂的剖析,极度适宜用于阅读论文。
总之,在 AI 行业里,改变的机会可能藏于论文。我们看到了相关现象和问题,好在腾讯「元宝」的更新带来了解决方案。
腾讯混元
,赞107
为了切实检验这一新功能所呈现的成效,机器之心展开了一番亲身的实际测试。
论文「精读」,精在哪儿?
运用 AI 来阅读论文究竟是何种感受?大多时候的情况是:当你给它递去一个 PDF 文件,它回馈给你的是一段总结以及若干条概述(有时甚至可能多达 10 条)。此类信息的确具备一定的助益,然而在某些时候,你很难清晰地辨别出哪些属于亮点,还有论文究竟解决了何种问题、未解决何种问题,有哪些核心的问题值得仔细探究。
我们通过实际测试察觉到,“元宝”是凭借提供一连串模块化、结构化的信息来处理这些难题的。
以我们所测试的一篇来自 SIGGRAPH 的论文作为示例。倘若你直接将论文投放进去,它所返回的总结与其他 AI 的差异并不显著。但是,只要你怀有耐心继续往下拉动,便能够看到一个“深度阅读该文档”的按钮,此乃“一键直通”论文精读的关键开关。
不管怎样,使用 AI 读论文的感受常常如此。我们实测了解到“元宝”的解决办法。就像测试的那篇论文,起初不明显,但关键按钮能开启精读。
和以往用于总结论文的界面存在差异,精读页面能够将论文拆解得分外有条理,研究背景、研究方法、实验设计、结果分析以及总体结论,分别被整理成为一个独立的模块,这和机器之心平常介绍论文的结构极为相似。所有的这些内容,均能够通过左侧的大纲实现快速跳转。
不管怎么说,新的精读页面独具特色,对论文拆解清晰,类似常见的介绍方式,还能通过大纲便捷跳转。
千万不要觉得每个模块的字数少,实际上这些文字蕴含的信息量极大。就拿研究背景这个模块来说,在“研究难点”段落,仅仅凭借三个短句就阐述了四个难点,而“相关工作”更是对第二章“related work”的极度凝练,区区一段话就将该领域的主要技术路线清晰地介绍到位。因此,在读完这个模块以后,我们大体上就能够明白论文所研究的究竟是何种问题,所面临的又是怎样的一种研究状况。
不仅是上述这些常规的结构化信息,元宝的精读还存在一个让人倍感惊艳的设计——它会把论文的优点和不足逐一罗列出来,有助于研究者迅速知晓自己能够从这篇论文当中获取到什么,还有哪些问题值得进一步深入研究。
不管怎样,元宝精读的这个独特设计,为研究者提供了极大的便利。
为何这个功能这般关键?中国台湾清华大学的教授彭明辉在有关论文阅读的一篇著述里曾经提及,论文与课本存在差异,课本会给予他人整理、组织好的系统性知识,然而论文需要读者自身从毫无组织的知识当中进行检索、筛选以及组织知识。其中,剖析既有研究的优点和缺点的能力尤为关键,这属于批判性思维的重要构成部分,也是在学术研究当中实现自我提升的重要渠道。元宝借助迅速分析并总结论文的优点和缺点,能够助力研究者节省大量用于筛选和初步理解的时间,让他们能够更为迅速地将注意力集中于和自身研究直接相关的论文上。
反正,这个功能在论文阅读中意义非凡,能带来诸多便利。
不过,倘若你认为前面的这些信息太过繁杂,你同样能够直接跳转至最后的“关键问题与解答”模块。在这里将会罗列几个最为关键的问题,使你能够迅速了解到论文的价值,从而判断是否值得花费时间去阅读原文。当然,此前的众多 AI 助手也会在答案的末尾展示一些关键问题,点击一下就能获取答案,可要是你是一名初涉此领域的新手或者具有跨学科背景的读者,你或许不太容易判断哪些问题更为关键。元宝这种直接呈现的方式给人的感觉要更加直观明了。
总归,元宝的这一模块设计,对于读者判断论文价值很有帮助。
原图原数,谁说 AI 读论文不能配图?
在阅读论文的过程中,不少人都存在这样一种习惯,那就是一边查看图表,一边阅览论文的相关描述。如此一来,理解的速度会更快,难度也会更低。然而,当下市面上的绝大多数 AI 应用所给出的大都是文字形式的结果,倘若想要看图,就不得不自己到原文当中去寻觅。
反正,这种现状给读者带来了不便。
举例来讲,如果在某个模块论述架构,那么它就会把与之对应的架构图展示出来:
如果在某个模块讲实验结果,那它会把对应的图表放上:
大家都清楚,大模型存在的幻觉问题至今仍无法彻底得到解决。所以,这种原汁原味呈现原图和原数据的方式实则是一种更为可靠的输出模式,便于读者随时对模型给出的答案加以验证,在当作参考时也更有保障。
这种呈现方式优势明显,值得肯定。
另外,经过我们的探索,还了解到,如果您有撰写博客之类的对外输出的需求,元宝能够为您绘制图表。并且您无需告知它数据的来源位置,它能够自行定位到论文里的相关表格,将数据提取出来并完成绘制。这一功能能够通过精读页面右侧的「提问」按钮予以激活。
不管怎样,元宝的这一功能为用户带来了很大的便利。
随时随地想读就读,谁说读论文障碍重重?
除开结构化的资讯以及图文兼具的输出成果,在我们展开的测试里,还惊喜地察觉到,元宝实际上具备一些极其实用的细微功能,能够让阅读论文这一行为变得愈发便捷。
首先要说的是划词翻译和搜索,这属于“原文”阅读界面的两个极为实用的细微功能。划词翻译能够为英语水平欠佳的读者随时随处清除语言方面的阻碍,而划词搜索则更进了一步,仿佛是将元宝的搜索功能打造成了一个插件,能够随时搜索相关的信息。并且,元宝所给出的解释并非只是简短的归纳总结,还存在模块化的拓展呈现,真正地将“结构化”、“富含信息量”融入到了每一个细微之处。
这些功能让元宝在处理论文阅读方面表现出色。
其次是“离线阅读”。此功能的妙处在于:能够使您在“飞行模式”下重温精读内容与原文,绝不浪费点滴碎片时间。这给航空公司在和高铁的竞争里增加了筹码。没准,研究者们的下一个灵感就出现在飞机上回看精读的时候。
最后一个令人惊喜的小功能是「计算器」。就在前段时间,AI 因无法准确分辨 9.9 和 9.11 孰大孰小而引发了诸多讨论。在元宝中,我们惊喜地发现它整合了计算器功能,能够切实依据准确的计算结果来生成答案。这种功能在我们阅览实验数据时用处极大。
不得不说,这个功能为用户带来了极大的便利。
长文精读的背后:专家指导至关重要
依据官方消息,腾讯元宝此次的升级重点在于「长文精读」,能够原生支持最长近乎 50 万字的输入。我们在测试中所采用的论文远远未达此长度,日常接触的论文大多亦如此。故而使用元宝来精读论文,多数情况下上下文窗口都是充足的。它的模块化、图文并茂的输出,还有划词搜索、翻译等小功能,着实让阅读论文这件事变得便捷、高效,在“实用性”方面又迈进了一大步。
这种进步离不开其背后的模型——腾讯混元大模型的优化升级。据了解,为了于专业领域增强模型的专业性和实用性,腾讯混元团队特地邀请领域专家归纳各专业领域的核心技能,并制定了专业问题的回答规范,促使模型能够真正如同领域专家一般提供服务。正因如此,我们在使用过程中能够明显感觉到,元宝清楚论文读者所需的信息以及信息应当如何呈现。
可以说,腾讯混元团队的努力为元宝的出色表现奠定了坚实基础。
除了论文,这一全新功能还能够用于精读财报、研报等长文本。在这些场景中,它能够从多个维度梳理信息,依据报告内容生成杜邦分析图等专业图表,让对这些文件一窍不通的人也能够明白企业的财务状况等信息。
无论如何,腾讯元宝的这一功能为广大用户带来了实实在在的便利。
然而,针对读论文这一场景而言,元宝的确还存在一定的可提升之处,像是在阅读原文的界面缺少完整的原文 - 译文对照,对公式的识别偶尔会不太精准等等。我们由衷期待元宝能够在后续的更新里完善这些问题。
不管怎样,元宝的未来发展值得我们持续关注。
但作为一款问世仅两个多月的应用,腾讯元宝的表现已然令人刮目相看。它的发展轨迹使我们得以预见,大模型将会怎样逐步转化为新的生产力。我们也满心盼望这个 APP 能够为我们创造更多的惊喜。
总之,我们对腾讯元宝充满了期待和信心。