GPT-4最强竞品迎来重磅升级:一次10万token,百页资料一分钟总结完毕

news2025/1/23 12:15:37
夕小瑶科技说 分享
来源 | 量子位
作者 | 丰色 萧箫

号称ChatGPT“最强竞争对手”的Claude,今天迎来史诗级更新——

模型记忆力原地起飞,现在1分钟看完一本数万字的小说,已经不在话下。

alt

消息一出,评论区直接炸了,网友们蜂拥而至,“woc连连”:

疯了疯了!
事情进展得太快了,又是为人类担心的一天!

alt alt

原来,这次更新,将模型的上下文窗口token数提到了足足10万,相当于7.5万个单词!

这意味着,大模型“记性”不好的缺陷现在得到补强,我们可以直接丢给它上百页上万字的材料,比如财报、技术文档甚至是一本书。

而它都能在一分钟之内帮你分析总结完毕!

alt

要知道,之前市面上几乎所有AI聊天机器一次都只能读取有限数量的文本,理解长资料里的上下文关系非常灾难。

而我们人类自己去处理大篇幅的文本又太慢了,比如光是要读完10万token的材料,就需要大约5个多小时,更别提还要花更多的时间去理解去消化才能进行总结。

现在,Claude直接一把搞定。

这波,简直是“五雷轰顶”、“反向开卷”GPT-4,因为,刚刚后者也不过才做到3.2万token。

所以,一次性比GPT-4多出3倍的处理量,Claude效果提升究竟如何?

Claude重磅更新:一次记忆10万token

据Anthropic官方介绍,升级后的Claude-100k版本,对话和任务处理能力双双得到极大提升。

一方面,是“一次性可处理文本量”的增加,直接拓宽了Claude的可从事岗位类型。

之前,大模型最多用来处理个几十页的文档。

现在,Claude已经能速读公司财报年报、技术开发文档、识别法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。

最关键的是,它不仅能通读全文总结其中的要点,还能进一步完成具体任务,如写代码、整理表格等。

例如,快速理解几百页的开发文档,并根据文档开发应用程序demo。

以Claude之前没见过的一项新技术LangChain作为示例:

alt

当交给它一个240页的LangChain API报告后,要求它快速给出一个LangChain的demo演示:

alt

几乎没用多少时间,Claude就快速给出了一个基于LangChain开发的应用程序demo:

alt

又例如,甩给它一个漫长但又不得不听的5小时知识播客:

alt

它不仅能将重点转成文字提取出来,还能快速整理表格,对观点进行分析:

alt

难度增大一点,30页的研究论文也能很好地处理,甚至能准确指定它整理某一章节的某一段落:

alt

除此之外,还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本,问Claude最适合拍摄的地点,它很快就能给出几个对应的参考地址:

alt

最后,官方还给出了一个《了不起的盖茨比》案例,虽然没有demo演示。

他们将这篇喂给Claude后,替换了其中一个角色Mr. Carraway,把他的角色变成“Anthropic里的一位工程师”,再交给Claude阅读,让它找不同。

几乎只用22秒钟,Claude就读完这本书,并发现了Mr. Carraway的“不同身份”。

另一方面则是“记忆力”的增加,带来了对话题掌控度的提升、以及聊天能力的提升。

此前大模型经常会出现“聊着聊着忘了话题”的情况,对话窗口总字数超过几千字后,开始胡言乱语。

举个栗子🌰,如果你用大量提示词设置了一个ChatGPT版猫娘,那么它开始聊天后,可能几个小时就忘记了自己和你说过的话,开始表现出一些“出轨”的迹象(手动狗头)

alt

但现在,拥有一次10万+个token记忆力的Claude,则不太可能出现这种情况,反而能牢牢记住和你聊过的话题,连续交谈上好几天。

那么,目前我们能通过什么方式用上最新版Claude呢?

API和网页版均已上线

各个大模型的研究测试传送门

阿里通义千问传送门:
https://tongyi.aliyun.com

百度文心一言传送门:
https://yiyan.baidu.com

ChatGPT传送门(免墙,可直接测试):
https://yeschat.cn

GPT-4传送门(免墙,可直接测试,遇到浏览器警告点高级/继续访问即可):
https://gpt4test.com

Anthropic先是宣布推出了Claude-100k的API版本,之后又火速上线了网页端。

Anthropic工程师
▲Anthropic工程师

所以无论你是用网页端还是用API,目前都已经可以直接体验这个拥有“超长记忆力”的Claude版本。

很快啊,已经有网友迫不及待玩上了。

像OthersideAI的CEO Matt Shumer,就试用了一下网页端的Claude-100k总结技术报告的效果。

他先测了波Claude-9k的效果,发现它面对长达上百页的GPT-4技术报告,还是会出现“幻觉”;随后测试新版Claude-100k,发现它给出了有理有据的估计:

GPT-4的参数量级大约在5000亿左右!

alt

这是它的推测过程:

alt

不知道这波OpenAI的奥特曼会不会出来辟谣(手动狗头)。

还有一位Assembly AI的老哥,测试了一下Claude-100k的API版本。

在视频演示中,他用Claude-100k总结了一下Lex Friedman的5小时长播客(内容与John Carmack有关),效果看起来也非常不错:

alt

但无论是网页版还是API,都还不是我们能免注册直接试玩的版本。

之前我们说的不用注册、不用申请、不用“骚操作”就能玩、体验也很不错的是slack端,它的添加方法我们在之前的文章中介绍过,非常简单。

遗憾的是,目前它还是Claude-9k“体验版”。

alt

所以,总结一下就是,这个Claude-100k的版本:

  • 可以用API的方式体验,不过不是免费的;

  • 网页版也行,但需要你有试用资格,没有就去申请,等一等;

  • Slack端还不行,只是个体验版。

反向开卷GPT-4,网友:卷对了方向

昨天,谷歌刚刚在I/O大会上宣布了数项重大更新,包括:

  • 重构谷歌搜索、开启AI对话

  • 发布大模型PaLM 2

  • 全面开放Bard,不用排队直接玩

……

这被视作针对微软和OpenAI的一系列反击。

图片

现在,来自Anthropic的Claude紧随其后,发布如此重大更新,直接反向开卷GPT-4——

有网友评价:

Claude卷对了方向。

alt

确实,目前大部分语言模型普遍都只能处理2-8k的token量,大家都在苦苦追寻提高模型记忆力的办法。

比如上个月那篇可将Transformer token上限扩展到100万甚至200万的论文就引起了非常大的关注,不过网友测试效果似乎不太理想。

alt

现在,Claude直接“业内第一人”宣布做到了100k,并拿出来给大家用,很难不让人称赞。

除此之外,还有网友“站得更高”,称:

资本主义之间的竞争果然很美妙。

alt

言外之意,卷得好啊卷得妙。没有巨头和各垂直企业之间的你争我抢,我们哪能在短短两天之间又目睹了如此多和重大的进展呢?

alt

诶,不过话说回来,鉴于Anthropic是由当初不满意OpenAI与微软走得太近的几位前员工创立,而谷歌也斥资3亿美元投资了这家公司。

大胆猜测:

这次两人前后脚的“一唱一和”,是不是提前商量好的?

参考资料

[1]https://techcrunch.com/2023/05/11/anthropics-latest-model-can-take-the-great-gatsby-as-input/
[2]https://twitter.com/AnthropicAI/status/1656700154190389248
[3]https://www.anthropic.com/index/100k-context-windows
[4]https://twitter.com/mattshumer_/status/1656781729485529089
[5]https://www.youtube.com/watch?v=2kFhloXz5_E

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/521864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HTTP第九讲——你能写出正确的网址吗?

应该用什么来标记服务器上的资源呢?怎么区分“这个”资源和“那个”资源呢? 用的是 URI,也就是统一资源标识符(Uniform Resource Identifier)。因为它经常出现在浏览器的地址栏里,所以俗称为“网络地址”&a…

猫妹人生中的第一张Python证书长这样(1)

小朋友们好,大朋友们好! 我是猫妹,一名爱上Python编程的小学生。 欢迎和猫妹一起,快乐学习,茁壮成长! 猫妹和她的朋友们 猫妹和她的朋友们有两层含义。 一是新的合集名称,在这个合集里面&am…

redis从零开始(3)----基本类型hyperloglog/geo/stream

接上文 redis基本类型 HyperLogLog 简介 HyperLogLog是用于「统计基数」的数据集合类型,基数统计就是指统计一个集合中不重复的元素个数, 但是准确率不是百分百,即他可以提供不精确的去重计数。HyperLogLog 的优点是,在输入元素…

.Net平台下OpenGL绘制图形(1)(VS2019,Winform,C#)

1、介绍 OpenGL(英语:Open Graphics Library,译名:开放图形库或者“开放式图形库”)是用于渲染2D、3D矢量图形的跨语言、跨平台的应用程序编程接口(API)。这个接口由近350个不同的函数调用组成…

【图解KMP算法】

🎉🎉🎉点进来你就是我的人了博主主页:🙈🙈🙈戳一戳,欢迎大佬指点! 欢迎志同道合的朋友一起加油喔🤺🤺🤺 目录 找出字符串中第一个匹配项的下标 1.什么是KMP…

Windows 下 VMware 虚拟机的 vmdk 文件的压缩

在 Windows 下玩虚拟机,一般大家都会安装 VMware 软件,然后通过软件安装其它操作系统环境(如 Linux)来模拟各个服务器环境。然而大家在使用过程中可以发现这样一个问题,那就是每个操作系统对应主机磁盘目录中&#xff…

与小我11岁的人一次PK

基本情况 时间过得很快,如同流水一般。 我的同事F已经离职一段时间了,怎么说呢? 公司领导的想让我们进行PK,谁是胜利者,谁留下,这的确与别的公司不同,别的公司通过面试,公司领导感觉那样不足体…

STC15单片机+nRF24L01硬件SPI通讯

STC15单片机+nRF24L01硬件SPI通讯 📍相关篇《STC15单片机+nRF24L01通讯利用PCA输入捕获触发》🔖验证对象:STC15L2K60S2📍STC15L2K60S2自制系统板硬件开源地址:https://oshwhub.com/perseverance51/stc15l2k60s2-ji-tong-ban⏱时钟频率:11.0592MHz🌼NRF24L01模块以及…

C#串口通信从入门到精通(11)——串口接收的数据存储到本地文件(txt、csv)

文章目录 前言一、将数据以CSV格式进行存储二、将数据以TXT格式进行存储三、全部代码前言 我们在串口通信程序开发中经常需要将串口接收到的数据存储到本地电脑,本文就来介绍如何在串口通信中将数据进行存储 一、将数据以CSV格式进行存储 我们将软件选择为csv文件存储,如下…

搭建React Native开发环境

1.安装node node.js官网 需要确定自己安装的版本是否是12版本以上 node -v 2.安装yarn npm install -g yarn 3.安装 Android Studio 这是官网推荐的安装地址: android studio 国内用户可能无法打开官方链接,请自行使用搜索引擎搜索可用的下载链接。安装界面中选…

一个27岁妹子的软件测试之路

艰难的测试之路 2023年,现在这个大环境下,软件测试行业卷麻了,应该说不仅仅软件测试这行,而是整个IT行业都卷麻了,但最卷的还是前端,真的是卷的发紫,今天想和大家聊聊我认识的一个妹子&#xf…

基于SpringBoot+Mybatis-plus+Myslq+ElementVue大学生健康档案管理系统

基于SpringBootMybatisMyslqElementVue大学生健康档案管理系统 一、系统介绍1、系统主要功能:2.涉及技术框架:3.本项目所用环境: 二、功能展示三、其它系统四、获取源码 一、系统介绍 1、系统主要功能: 项目分为个人信息、个人健…

使用 @Autowired 依赖注入时警告不建议使用字段注入

文章目录 字段注入缺点无法注入 final 字段与 Spring 容器耦合度高 构造器注入(Spring 官方推荐)Setter 方法注入 在 Spring 中注入依赖时有字段注入、构造器注入、Setter 方法注入三种注入方式。 字段注入缺点 无法注入 final 字段 在 Spring 2.5 中引…

【C++】8.编译:CMake工具入门

😏*★,*:.☆( ̄▽ ̄)/$:*.★* 😏这篇文章主要介绍CMake工具的入门使用。————————————————学其所用,用其所学。——梁启超————————————————— 欢迎来到我的博客,一起学习知识…

Istio Ambient Mesh L4: 剖析ztunnel组件的工作原理

前言 早在2021年,Istio就开始了共享代理模式的探索,并于2022年9月推出的Ambient Mesh——无Sidecar的全新数据平面模式,目前还未发布正式版本。 这篇博客是花了好多时间收集整理出来的,按照学习思路,先简介了 Istio …

vue3项目搭建超详解

vue3安装与目录讲解 文章目录 vue3安装与目录讲解安装node.jsnpm绑定淘宝镜像安装vue脚手架创建vue项目目录解释推荐使用vscode 安装node.js http://nodejs.cn/download/ 根据自己电脑的位数自行下载。可安装到任意盘哈,因为我C盘比较大,我就直接在C盘了…

[IOT物联网]Python快速上手开发物联网上位机程序——前言

一、什么是Python Python是一种简单易学、高级、通用的编程语言。它是一种解释型语言,不需要编译即可运行,因此可以快速地进行开发和测试。Python具有简洁优美的语法,使用它可以提高生产力和代码可读性。Python拥有强大的标准库和第三方库&am…

windows10下设置本地apache\nginx站点部署ssl证书,使本地配置的域名可以用https访问

首先我们需要下载openssl来生成证书文件: 去官方网址下载https://slproweb.com/products/Win32OpenSSL.html; 下载好了,双击exe文件,然后就下一步,下一步安装完成; 安装之后配置环境变量,新建…

工赋开发者社区 | 何谓智能工厂?国内外智能工厂建设的现状分析

导读 本文将分析国内外智能工厂建设的现状与问题,智能工厂的内涵,以及推进智能工厂建设的成功之道。 1 国内外智能工厂建设的现状分析 近年来,全球各主要经济体都在大力推进制造业的复兴。在工业4.0、工业互联网、物联网、云计算等热潮下&am…

MDPI参考文献引用

在引参考文献的时候,MDPI论文有一个统一的格式要求,这里是帮助那些不会快速引文献的同学快速引用MDPI格式的参考文献。 【1】首先安装endnote,并创建仓库 【2】下载endnote识别的MDPI输出参考文献格式类型:https://endnote.com/style_downl…