ChatGPT「最强竞争对手」Claude有了史诗级更新~~~百页数据一分钟读完还能做出总结

news2024/12/22 2:24:33

号称ChatGPT「最强竞争对手」的Claude,迎来史诗级更新——
模型记忆力原地起飞,现在1分钟看完一本数万字的小说,已经是一件很理所当然的事情了。

在这里插入图片描述

消息一出,评论区直接炸了,网友们蜂拥而至,「wocao连连」:

在这里插入图片描述

原来,这次更新,将模型的上下文视窗token数提到了足足10万,相当于7.5万个单词!
这意味着,大模型「记性」不好的缺陷现在得到补强,我们可以直接丢给它上百页上万字的材料,比如财报、技术文件甚至是一本书。
而它都能在一分钟之内帮你分析总结完毕!

在这里插入图片描述

要知道,之前市面上几乎所有AI聊天机器一次都只能读取有限数量的文本,理解长数据里的上下文关系非常灾难。
而我们人类自己去处理大篇幅的文本又太慢了,比如光是要读完10万token的数据,就需要大约5个多小时,更别提还要花更多的时间去理解去消化才能进行总结。
现在,Claude直接一次搞定。
这波,简直是GPT-4难以置信,因为,刚刚GPT-4才做到3.2万token。

所以,一次性比GPT-4多出3倍的处理量,Claude效果提升究竟如何?
Claude重磅更新:一次记忆10万token
据Anthropic官方介绍,升级后的Claude-100k版本,对话和任务处理能力双双得到极大提升。
一方面,是「一次性可处理文本量」的增加,直接拓宽了Claude的可从事职务类型。
之前,大模型最多用来处理个几十页的文件。
现在,Claude已经能快速阅读公司财报年报、技术开发文件、辨识法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。
最关键的是,它不仅能通读全文总结其中的要点,还能进一步完成具体任务,如写代码、整理表格等。
例如,快速理解几百页的开发文件,并根据文件开发应用程序demo。
以Claude之前没见过的一项新技术LangChain作为示例:

在这里插入图片描述

当交给它一个240页的LangChain API报告后,要求它快速给出一个LangChain的demo演示:
在这里插入图片描述
几乎没用多少时间,Claude就快速给出了一个基于LangChain开发的应用程序demo:
在这里插入图片描述

又例如,丢给它一个漫长但又不得不听的5小时知识型Podcast:
在这里插入图片描述
它不仅能将重点转成文字提取出来,还能快速整理表格,对观点进行分析:
在这里插入图片描述
难度增大一点,30页的研究论文也能很好地处理,甚至能准确指定它整理某一章节的某一段落:
在这里插入图片描述
除此之外,还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本,问Claude最适合拍摄的地点,它很快就能给出几个对应的参考位址:
在这里插入图片描述
最后,官方还给出了一个《大亨小传》案例,虽然没有demo演示。
他们将这篇喂给Claude后,替换了其中一个角色Mr.Carraway,把他的角色变成「Anthropic里的一位工程师」,再交给Claude阅读,让它找找看有什么不同。
几乎只用22秒钟,Claude就读完这本书,并发现了Mr.Carraway的「不同身份」。
另一方面则是「记忆力」的增加,带来了对话题掌控度的提升、以及聊天能力的提升。
此前大模型经常会出现「聊着聊着忘了话题」的情况,对话视窗总字数超过几千字后,开始胡言乱语。
举个例子,如果你用大量提示词设置了一个ChatGPT版猫娘,那么它开始聊天后,可能几个小时就忘记了自己和你说过的话,开始表现出一些「出轨」的迹象。
但现在,拥有一次10万+个token记忆力的Claude,则不太可能出现这种情况,反而能牢牢记住和你聊过的话题,连续交谈上好几天。
那么,目前我们能透过什么方式用上最新版Claude呢?
API和网页版均已上线
Anthropic先是宣布推出了Claude-100k的API版本,之后又火速上线了网页端。
在这里插入图片描述
所以无论你是用网页端还是用API,目前都已经可以直接体验这个拥有「超长记忆力」的Claude版本。
很快啊,已经有网友迫不及待的开始玩了。
像OthersideAI的CEO Matt Shumer,就试用了一下网页端的Claude-100k总结技术报告的效果。
他先测了波Claude-9k的效果,发现它面对长达上百页的GPT-4技术报告,还是会出现「幻觉」;随后测试新版Claude-100k,发现它给出了有理有据的估计:
GPT-4的参数量级大约在5000亿左右!这是它的推测过程:
在这里插入图片描述
但无论是网页版还是API,都还不是我们能免注册直接试玩的版本。
之前我们说的不用注册、不用申请就能玩、体验也很不错的是slack端,它的加入方法我们在之前的文章中介绍过,非常简单。
遗憾的是,目前它还是Claude-9k「体验版」。
所以,总结一下就是,这个Claude-100k的版本:
可以用API的方式体验,不过不是免费的;
网页版也行,但需要你有试用资格,没有就去申请,等一等;
Slack端还不行,只是个体验版。
在这里插入图片描述
挑战GPT-4,网友:方向对了
昨天,Google刚刚在I/O大会上宣布了数项重大更新,包括:
重构Google搜寻、开启AI对话
发表大模型PaLM 2
全面开放Bard,不用排队直接玩
……
这被视作针对微软和OpenAI的一系列反击。
在这里插入图片描述
现在,来自Anthropic的Claude紧随其后,发表如此重大更新,直接打向GPT-4——
确实,目前大部分语言模型普遍都只能处理2-8k的token量,大家都在苦苦追寻提高模型记忆力的办法。
比如上个月那篇可将Transformer token上限扩展到100万甚至200万的论文就引起了非常大的关注,不过网友测试效果似乎不太理想。

在这里插入图片描述
现在,Claude直接「业内第一人」宣布做到了100k,并拿出来给大家用,很难不让人称赞。
除此之外,还有网友「站得更高」,称:
在这里插入图片描述
言外之意,这波你来我往的竞争对消费者实在太好了。没有巨头和各垂直企业之间的你争我抢,我们哪能在短短两天之间又目睹了如此多和重大的进展呢?不过话说回来,鉴于Anthropic是由当初不满意OpenAI与微软走得太近的几位前员工创立,而Google也斥资3亿美元投资了这家公司。那么,这次两人前后脚的「一唱一和」,是不是提前商量好的?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/531171.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

报表解决方案Telerik Reporting - 轻松完成嵌入式报表开发

假设您是一名开发人员,思考一下您的用户将从Web报表设计器中得到什么吗?他们能突出异常数据吗?他们能够从头开始创建一个报告吗?让我们站在商业用户的角度,看看这到底是怎么回事。 Telerik Reporting Web Designer是一个多功能且用户友好的…

Redis系列--redis管道

一、前言 1、reids客户端向服务端发送命令分四步(发送命令-命令排队-命令执行-返回结果),并监听socket返回,通常以阻塞模式等待服务端响应。 2、服务端处理命令,并将结果返回给客户端 以上两步称为:Roun…

榜店商城独立版禾匠队列服务测试失败问题解决方法-开启禾匠队列教程

发现很多用户在安装完成后或者在使用独立版本的过程中可能突然会遇到测试不通过,队列测试失败的情况,安装完成后输入站点域名登录到商城后台,先清理缓存然后进入“设置”-“队列服务”,按要求启动服务并测试服务是否正常运行,如果运行失败的话,如下图所示 这里狮子喵就给…

端子引脚焊接异常分析

No.1 案例概述 PCBA端子引脚焊接发生异常,通过对PCBA基板和端子进行一系列分析,定位到问题发生的原因在于共面性不良,且端子焊接引脚与锡膏接触程度不足导致。详细分析方案,请浏览文章获知。 Q:什么是共面性? 共面性也…

第一章 Java语言概述

一 Java知识脉络图 1.1 Java基础全程脉络图 1.2 本章专题与脉络 二 计算机的硬件与软件 2.1 计算机组成:硬件软件 2.2 CPU、内存与硬盘 CPU(Central Processing Unit,中央处理器) 人靠大脑思考,电脑靠CPU来运算、控…

LocalAI - 兼容OpenAI API的本地大模型技术栈【LLM】

LocalAI 是一个用于本地推理的 与OpenAI API 规范兼容的REST API, 它允许使用消费级硬件在本地或本地运行模型,支持llama.cpp、alpaca.cpp、gpt4all.cpp、rwkv.cpp、whisper.cpp、vicuna、koala、gpt4all-j、cerebras 等大模型。 推荐:用 NSD…

linux入门---模拟实现命令行解释器

目录标题 前提准备工作 前提 平时使用指令操作linux系统的时候可能会输入一些不好的指令,这些指令可能会对操作系统内核造成影响,所以就有了命令行解释器这个东西,它会过滤掉那些不好的指令从而让linux系统更加的安全,比如说我们…

初识linux之线程池与一些常见的锁

目录 一、线程池的概念 1. 线程池的概念 2. 线程池的应用场景 二、模拟实现一个线程池 1. 线程的简单封装 2. 锁的简单封装 3. 线程池的模拟实现 3.1 整体结构及头文件 3.2 构造函数 3.3 析构函数 3.4 线程启动 3.5 传入任务 3.6 整体结构 三、线程安全的单例模式…

向基于语义模型的操作集成的演变

在过去的许多年里,已经定义了许多架构方法,用于系统集成以及其信息和流程的表示。这些方法包括面向数据、面向消息、面向服务和面向信息的方法。需要探讨的问题是: 这些不同的方法有何不同和联系?从实时运营整合架构的角度来看&a…

MQTT协议理解

提示:记录mqtt服务搭建及访问教程 文章目录 前言一、MQTT是什么?二、使用步骤1.MQTT服务器搭建2.MQTT集成 总结 前言 一直想了解下mqtt,本人又懒,被动型学习,刚好项目需要,此篇记录下MQTT搭建过程及心得体…

小模型媲美2000倍体量大模型,谷歌提出新思路:蒸馏也能Step-by-Step

深度学习自然语言处理 原创作者:林哲乐 论文:Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes地址:https://arxiv.org/pdf/2305.02301.pdf录取:ACL2023 进NLP群…

在JavaScript中4种创建枚举方式

本文译者为 360 奇舞团前端开发工程师 原文标题:4 Ways to Create an Enum in JavaScript原文作者:Dmitri Pavlutin原文地址:https://dmitripavlutin.com/javascript-enum/ 使用枚举(enum)可以方便地表示一个变量&…

一个通用的多相机视觉SLAM框架的设计和评估

文章:Design and Evaluation of a Generic Visual SLAM Framework for Multi-Camera Systems 作者:Pushyami Kaveti, Arvind Thamil Chelvan Hanumant Singh 编辑:点云PCL 来源:https://arxiv.org/pdf/2210.07315.pdf 代码&#x…

针对基于智能卡进行认证的活动目录的攻击

最近,我参与了一项攻击基于智能卡的活动目录的工作。实际上,你根本不需要使用物理智能卡来验证登录这个活动目录。证书的属性决定了它是否可以用于基于智能卡进行登录。因此,如果你能获得相应的私钥,那么就可以绕过智能卡的验证实…

借助ChatGPT自动生成PPT

借助ChatGPT自动生成PPT 首先让GPT生成一段markdown格式的PPT内容,尽量描述全面,以什么语言,什么格式,排版等等。 打开mindshow网址,点击import and create,选择以markdown方式创建,再次点击弹…

LayerNorm 在 Transformers 中对注意力的作用研究

LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。 其实这只是部分正确:Brody、Alon 和 Yahav 的一篇题为“On the Expressivity Ro…

LabVIEWCompactRIO 开发指南20 应用程序接口

应用程序接口 STMAPI如图4.24所示。对于基本操作,它由一个读VI和一个写VI组成。它还具有两个补充VI,以帮助传输元数据,但它们的使用不是强制性的。每个主要的VI都是多态,这意味着可以将它们与不同的传输层一起使用。本文档讨论基…

WMS 窗口添加流程

WMS 系统窗口添加流程 文章目录 WMS 系统窗口添加流程一. addView二. addView代码分析2.1 应用端调用WindowManager的addView2.2 WindowManager的实现类是WindowManagerImpl2.3 WindowManagerGlobal2.4 setView2.4 addToDisplayAsUser(Session.java)2.5 …

韦东山Linux驱动入门实验班(2)hello驱动---驱动层与应用层通讯,以及自动产生设备节点

前言 (1)学习韦东山老师的Linux,因为他讲的很精简,以至于很多人听不懂。接下来我讲介绍韦东山老师的驱动实验班的第二个Hello程序。 (2)注意,请先学习完视频再来看这个教程!本文仅供…

Oracle数据库实现limit功能

Oracle数据库不支持mysql中limit功能&#xff0c;但可以通过rownum来限制返回的结果集的行数&#xff0c;rownum并不是用户添加的字段&#xff0c;而是oracle系统自动添加的。 #1、使查询结果最多返回前100行&#xff1a; SELECT * FROM TESTSDK WHERE rownum<10; #2、查询结…