GPT-4 最强竞争对手,Claude 杀疯了!

news2025/1/11 22:40:47

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

d798be3e48b476f4b35a6500107eaaa5.jpeg

在今年早些时候,ChatGPT、Bard、Claude 等大语言模型,在 AI 领域呈三权鼎立之势,无人能出其右,被视为是能力表现最为卓越的 3 款 AI 聊天机器人。

其中以 OpenAI 为首发布的 ChatGPT 面向大众亮相时间最早,其多年沉淀而展现出来的 AI 技术,也令不少用户惊呼 AGI 时代或许即将来临。

Google 紧随其后,匆匆发布了 Bard,但表现平平。尽管前阵子对外公布了 PaLM2 大模型,试图与 GPT-4 一争高下,可惜终究还是无法撼动其王者地位。

反观早期备受冷漠的 Claude,随着其各项技术的不断提升与突破,现在其能力已可跟 GPT-4 一较高下,被业界认定为最有可能将 GPT-4 拉下王座的黑夜刺客。

今天,我们就来聊聊这个在 AI 领域大杀四方的新晋之秀:Claude。

Claude 母公司为 Anthropic,成立于 2021 年,其创始人为 OpenAI 团队的早期成员 Dario Amodei,曾担任 OpenAI 前研究副总裁,亲身在科技前沿领导与见证了 AI 近几年的不断崛起与突破。

迄今为止,该公司已筹集 14.5 亿美元,估值为数十亿美元。随着产品的不断迭代,该公司市值也在如火箭般迅猛飙升。

此前 Claude 发布产品更新,将原有大模型的 Token 上限从 9K 硬生生拉到了 100K(约 7.5 万个单词),是 GPT-4 最大 Token 上限 32K 的三倍多。

用户可以直接将一本《了不起的盖茨比》小说,直接丢给 Claude,让它总结并提取小说中的关键内容。无需再像 GPT-4 一样,需要将文本进行切割,再分多次喂给 AI。

这么做,无疑省下了很多工作量,同时也进一步减少信息的丢失。此举让 Claude 名声大噪,并重新进入了人们的视野。

前两天,Anthropic 又重磅宣布,将正式对外发布全新 Claude 2.0 版本。

71bdc16c0ca9e38dcd5fc2c5de8faef9.png

相对于此前的 1.3,Claude 2 无论是在人类考试,还是代码编写上,其能力都开始得到了肉眼可见的提升。

本次更新,也面向全体用户开放了 Claude 的 Web 入口(https://claude.ai/),在此之前,需要先向 Anthropic 提交内测申请,进入候补清单,等团队通过后才能使用。

与旧版 Claude 一样,Claude 2 同样可以实现跨文档搜索、总结、编写代码并回答有关特定主题的问题。

更令人振奋的是,Claude 的 Token 上限在本次更新中又一次得到提升。目前理论上支持 200K Token,该特性将会在后续逐步向用户开放。果然,能打败 Claude 只有 Claude 自己。

在编程能力上的测试上(HumanEval 编码),Claude 与 GPT-4 的得分为 71.2% 和 67%,成功击败了 GPT-4。

Claude-100K 的 API 使用成本,也比 GPT-4-32K 版本要便宜整整 4-5 倍,进一步减少了开发者的开销,让更多人能用上低成本的 AI 产品。

不仅如此,Claude 的训练数据截止到 2023 年初,GPT-4 的则是 2021 年 9 月,虽说目前有各种 ChatGPT 插件支持,已经能做到信息实时搜索查询,但其效果还是远远不如大模型的内嵌知识库。

针对这一特性,我专门做了下数据验证,向 Claude 询问 ChatGPT 的发布时间,结果准确无误。

bf089011318c47990c68813f7cc16cda.png

两两相比较之下,这波 Claude 又得一分。

在 Claude 提供的网页客户端上,用得最爽的一点,就是它能够直接读取你上传的各种 PDF、TXT、Word 文档,并提供内容总结、文案润色、信息筛选与提取等操作。

配合上其当前 100K 的 Token 上限,效果极其炸裂。

为了测试 Claude 的 PDF 读取功能,我特地拿了前几天在公众号发表的这篇文章:3 个令人惊艳的 GitHub 开源项目,诞生了!直接上传喂给 Claude ,并让 Claude 提取其中的主要内容。

结果表明,Claude 能够很好生成每个项目的对应介绍,它甚至还可以单独提取里面每个开源项目的 GitHub 地址,确实强大。

0dbb9bac94d8b25665fff26a1f2f3f8b.png

随着 Claude 功能特性的不断迭代,其母公司 Anthropic  的发展也如日中天。

早些时候,Google 便承诺向 Anthropic 投资 3 亿美元,以获得该初创公司 10% 的股份。

不过即便有这笔钱加持,对于大语言模型行业的烧钱速度,几个亿还是杯水车薪。

根据行业专业分析,Claude 想打造一个真正可靠且强大的聊天机器人,预计还需要在未来两年,投入 50 亿美元。

这些钱大部分都会用于专业人员招聘,数万个 GPU 集群构建,以获得更多人才与算力,在基础设施建设这块,接下来的一年半,应该就得花掉 10 亿美元,这烧钱速度着实恐怖。。。

在过去这段时间,Claude 凭借一己之力,成功让 ChatGPT 一家独大的局面被正式打破。

几个巨头的激烈竞争之下,作为普通用户,我们也获益良多。

除了 API 的使用成本正在逐渐下降,各个大模型的能力也在不断优化与迭代,真正做到了加量不加价。

在新的 AI 浪潮裹挟之下,也让我们得以再次见证人类群星的不断闪耀,并慢慢往着通用人工智能时代逐步靠近。

由于今年 AIGC 较火,为此我们也建立了一个 AI 社群,探索更多人工智能领域的前景与应用。

如果你想了解更多实用的 AI 技术与应用,以及 ChatGPT 新进展,可以点击下方链接,加入我们社群进一步交流探讨。

社群入口:ChatGPT 社群,正式上线!

不想错过文章推送?点击下面公众号卡片,给 GitHubDaily 公众号加个星标吧!

8a929e66bd95fb6d1e0bebdaf43b424c.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/751706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

阿里云无影云电脑具体价格_云桌面不同配置1元报价

阿里云无影云电脑配置费用,4核8G企业办公型云电脑可以免费使用3个月,无影云电脑地域不同费用不同,无影云电脑是由云桌面配置、云盘、互联网访问带宽、AD Connector、桌面组共用桌面session等费用组成,阿里云百科分享阿里云无影云电…

大模型的“第一性原理”:技术创新与社会价值的接轨

随着时间来到2023年第三季度,国产大模型已经达到100多个,“百模大战”正式开启。 大模型,我们有了很多选择,也开始呈现出某种同质化。除了拼参数、比背景、看榜单,有没有其他方法,让我们更好地判断一个大模…

解决Gson解析json字符串,Integer变为Double类型的问题

直接上代码记录下。我代码里没有Gson包,用的是nacos对Gson的封装,只是包不同,方法都一样 import com.alibaba.nacos.shaded.com.google.common.reflect.TypeToken; import com.alibaba.nacos.shaded.com.google.gson.*;import java.util.Map;…

经典CNN(一):ResNet-50算法实战与解析

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者:K同学啊|接辅导、项目定制 1 ResNet理论 深度残差网络ResNet(deep residual network)在2015年由何凯明等提出,因为它简单与实用并存,随后很多研究…

Hutool工具类 -集常用工具类为一体 - 工具类之大成

文章目录 说在前面的话简介gitee介绍项目介绍 网址gtiee 网址github 网址 安装pom依赖引入 :下载jar 文档中文文档中文备用文档参考API视频介绍 部分截图首页包含组件(总)IO流相关部分工具类(Util)集合类HTTP客户端 功能不再一一赘述和截图,具体请查看官…

详解TCP协议

TCP协议段格式 序号和确认序号:在真实服务器和客服端通信过程中请求是并行执行的,这会导致到达是乱序的,所以才会有序号这个东西,确认序号是对方应答时返回的,例如序号发送到1,确认序号会返回2,…

计算机网络 day6 arp病毒 - ICMP协议 - ping命令 - Linux手工配置IP地址

目录 arp协议 arp病毒\欺骗 arp病毒的运行原理 arp病毒产生的后果: 解决方法: ICMP协议 ICMP用在哪里? ICMP协议数据的封装过程 ​编辑 为什么icmp协议封装好数据后,还要加一个ip包头,再使用ip协议再次进…

springboot农机电招平台

本系统为了数据库结构的灵活性所以打算采用MySQL来设计数据库,而java技术,B/S架构则保证了较高的平台适应性。本文主要介绍了本系统的开发背景,所要完成的功能和开发的过程,主要说明了系统设计的重点、设计思想。 本系统主要是设…

关于java垃圾回收的小结

一、为什么要有垃圾回收 我们每次创建对象都需要在栈上开辟空间,堆上使用内存,如果我们只是开辟了这个空间,而不去释放他,那么再大的内存和空间也会有满的一天,所以我们在Java中引入了GC(垃圾回收机制&…

Foxit PDF ActiveX 5.9.8 Crack

Foxit PDF SDK ActiveX 即时添加PDF显示功能至Windows应用程序,快速投放市场,可视化编程组件功能强大且易于使用的PDF软件开发工具包 对于刚接触PDF或不愿投入过多精力学习PDF技术的产品管理者及开发者来说,Foxit PDF SDK ActiveX无疑是理想…

中国1km分辨率逐月平均气温数据集(1901-2022)

时间分辨率月空间分辨率1km - 10km共享方式开放获取数据大小9.71 GB数据时间范围 1901.1-2022.12 数据集摘要 该数据为中国逐月平均温度数据,空间分辨率为0.0083333(约1km),时间为1901.1-2022.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的…

对Vue组件化开发思想的一些理解

目录 组件的分类 为什么需要组件化开发 如何设计组件 组件间通信 组件系统是 Vue的一个重要概念,让我们可以用独立可复用的小组件来构建大型应用。几乎任意类型的应用的界面都可以抽象为一个组件树: 写一个 Vue 项目,其实就是在写一个个的…

接口测试 react+unittest+flask 接口自动化测试平台

目录 1 前言 2 框架 2-1 框架简介 2-2 框架介绍 2-3 框架结构 3 平台 3-1 平台组件图 1 新建用例 2 生成测试任务 3 执行并查看测试报告 3-2 用例管理 3-2-1 用例设计 3-3 任务管理 3-3-1 创建任务 3-3-2 执行任务 3-3-3 测试报告 3-3-4 邮件通知 1 前言 构建…

idea新建xml模板设置,例如:mybatis-config

在idea怎么新建mapper.xml文件&#xff0c;具体操作步骤和结果如下&#xff0c;其他文件也是可以自定义模板的流程和步骤一致&#xff01; 效果如下&#xff1a; 步骤如图&#xff1a; step1&#xff1a; step2&#xff1a; 文件内容&#xff1a; <?xml version"…

Android.mk 文件使用解析

和你一起终身学习&#xff0c;这里是程序员Android 经典好文推荐&#xff0c;通过阅读本文&#xff0c;您将收获以下知识点: 一、Android.mk 简介二、Android.mk 的基本格式三、Android.mk 深入学习一四、 Android.mk 深入学习二五、 Android.mk 深入学习三六、 Android.mk 判断…

C++【哈希表的模拟实现】

✨个人主页&#xff1a; 北 海 &#x1f389;所属专栏&#xff1a; C修行之路 &#x1f383;操作环境&#xff1a; Visual Studio 2019 版本 16.11.17 文章目录 &#x1f307;前言&#x1f3d9;️正文1、模拟实现哈希表&#xff08;闭散列&#xff09;1.1、存储数据结构的定义1…

MySQL函数以及存储过程

创建表并插入数据‘ 字段名 数据类型 主键 外键 非空 唯一 自增 id INT 是 否 是 是 否 name VARCHAR(50) 否 否 是 否 否 glass VARCHAR(50) 否 否 是 否 否 sch 表内容 id name glass 1 xiaommg glass 1 2 xiaojun glass 2 mysql> select * from sch; -------------------…

火车头采集器下载中文图片地址报错:发生错误终止..

火车头采集器下载中文图片地址报错&#xff1a;发生错误终止.. 报错信息 该问题时网友发现的&#xff0c;采集的内容中图片URL地址包含中文字符。 然后在采集内容时火车头自动下载图片就提示&#xff1a;发生错误终止&#xff0c;远程服务器返回错误&#xff1a;&#xff08…

MySQL 主从延迟的常见原因及解决方法

主从延迟作为 MySQL 的痛点已经存在很多年了&#xff0c;以至于大家都有一种错觉&#xff1a;有 MySQL 复制的地方就有主从延迟。 对于主从延迟的原因&#xff0c;很多人将之归结为从库的单线程重放。 但实际上&#xff0c;这个说法比较片面&#xff0c;因为很多场景&#xf…

我司的短信接口被刷了

如何发现的 成本分摊系统&#xff0c;将成本分摊给业务部门时&#xff0c;业务部门对账&#xff0c;发现某一类型的短信用量上涨了100多倍 排查调用来源时&#xff0c;发现来源为C端用户&#xff0c;由于调用量异常高&#xff0c;业务反馈近期无活动&#xff0c;因此怀疑被刷…