突如其来:OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3

news2024/11/26 0:35:46

突如其来的消息,OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3

这货居然在默默无闻中一举超越了GPT-4的地位。没发布会,没吹牛逼,就发了一帖子。

字少,事大。

Claude3独挡一面的推理能力

Anthropic推出了三款模型:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。这个命名真是有意思,Opus(超大杯)、Sonnet(大杯)、Haiku(中杯),一看就知道规模大小。

首先得提一句,Claude3的Opus模型似乎在全面碾压GPT-4上拔得头筹。

有人搞了个MGSM测试集,也就是多语言数学推理,Claude3 Opus用0-shot的方式达到了90.7%的准确率,而GPT-4居然要用8-shot,结果才74%。

0-shot就是大模型直接上阵,不给任何示例,8-shot是在上阵前给了8个示例。这区别一看就明显,GPT-4都给了8个示例了还输给了Claude3 Opus。

在复杂的推理任务上,Claude3简直就是GPT-4的克星。

再看其他测试集,比如MMLU、GSM8K这些语言知识的测试集,Claude3和GPT-4差不多水平,总体来说,提升主要在推理能力上。

Claude3 Opus,就是个厉害的货。不过有点小插曲,得付费才能玩这个。Anthropic的花样还真跟OpenAI一样,免费的只有Sonnet,Opus得交20刀的会员费才能撸。

PS:那么推荐个虚拟信用卡平台,专门解决这种海外业务付费订阅问题 WildCard平台虚拟卡开好之后,用支付宝充值就可以进行Opus升级。

Claude3最大的进化点,就是推理和逻辑。虽然单看参数你可能感觉不到,但有人专门给了初中的数学题,推理题,等等致命题。在已经明确了补集法的情况下,GPT-4的错误率竟然高达50%多。而Claude3 Opus,准确率高达90%。简直刷新认知。 总体看,Claude在逻辑和推理上的进化巨大,初中的理科题基本上是随便玩,不过高中题还是有点难度,全线阵亡状态。不过,一些看似弱智的问题或者语义逻辑,Claude3已经是无往而不利了。

Claude3和GPT4V打平的多模态

再说说多模态,GPT-4V也出来很久了,多模态功能可是个把人离不开的好东西。这次Claude3也不甘示弱,把视觉能力给强化了。你可以直接扔图进去,整体评价是,跟GPT-4V大致打平手。官方数据也有这样的倾向。

总体上,跟GPT-4V差不多,对中文的支持也不错,算是Anthropic弥补了一直以来Claude的短板。

基于超长文本的对话、总结、查询能力,在Claude3中也终于有了质的飞跃。当然,得说实话,Kimi都在这方面耕耘了差不多半年,Claude3现在也才刚刚赶上Kimi在长文本这块的水平。 但是综合来看,Claude3 Opus,绝对是目前最厉害的大模型。或者说,就是当前的No.1。

这次更新,Claude3还有一些其他特点。比如减少了不必要的拒绝,准确性更高等等,但是我觉得就不展开说了。Claude3这次更新后,不仅有独一档的推理能力,跟GPT-4V打平的多模态,还有200K长文本优化。

可以当之无愧地说,Claude3 Opus就是市面上目前最强的大模型。

当然,OpenAI和奥特曼的尿性你了解的,他们这肯定忍不了这口气。评论区里,网友说出了我的心声。Anthropic这么一出手,Claude3一露面,GPT-4的地位有点危险了。

期待一手ChatGPT 5

未来的竞争,肯定会更加激烈。看看评论区,网友们早就开始猜OpenAI会怎么回应了。Anthropic这一次搞得风生水起,GPT-4的霸主地位真的有点摇摇欲坠。ChatGPT 5是不是可以出手了,这一场巅峰对决,我可是期待了好久。

参考:https://aliyuntm.com/chatgptplus/claude3.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1582707.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux--进程的概念(一)

目录 一、冯诺依曼体系结构二、操作系统2.1 什么是操作系统2.2 操作系统的意义 三、进程3.1 进程的基本概念3.2 描述进程——PCB3.3 进程和程序的区别3.4 task_struct-PCB的一种3.5 task_struct的内容分类 四、如何查看进程4.1 通过系统文件查看进程4.2 通过ps指令查看进程 五、…

nginxWebUI配置conf

在左边相应位置写入要修改的语句后,依次点击“校验文件”、“替换文件”、“重新装载”即可重启conf

前端mock数据——使用mockjs进行mock数据

前端mock数据——使用mockjs进行mock数据 一、安装二、mockjs的具体使用 一、安装 首选需要有nodejs环境安装mockjs:npm install mockjs 若出现像上图这样的错,则只需npm install mockjs --legacy-peer-deps即可 src下新建mock文件夹: mo…

HTML+CSS+JS实现京东首页[web课设代码+模块说明+效果图]

系列文章目录 文章目录 系列文章目录前言一、HTML结构图二、CSS部分代码图三、每部分效果图展示3.1 导航栏、头部搜索栏效果图3.2 中心区域商品展示效果图3.3 秒杀区和特惠区域效果图3.4 页脚(底部导航、版权信息、技术支持等内容)效果图 总结 前言 用时…

RAG 修炼手册|一文讲透 RAG 背后的技术

在之前的文章中《RAG 修炼手册|RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要》,我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性,也回顾了如何借助向量数据库提升 RAG 实战效果。 今天我们继续剖析 RAG&#xf…

统一用安卓Studio修改项目包名

可以逃跑,可以哭泣,但不可以放弃 --《鬼灭之刃》 修改项目包名 1)选中项目中药修改的包名: 2)目结构显示方式,取消 Compact Middle Packages 选项; 3)右键要修改的包名,选择 Refactor —— Re…

企业焦急等待!湖北交安ABC证为何迟迟不开考?

企业焦急等待!湖北交安ABC证为何迟迟不开考? 2024年湖北公路水运安全员ABC交安ABC证为何迟迟不开考 2024年湖北交安ABC预计考核大概时间是6月份,以往每年4月份就开始发布考核计划,年初交安ABC报名系统更新维护,一直没…

书生·浦语大模型第二期实战营第二课笔记和基础作业

来源: 作业要求:Homework - Demo 文档教程:轻松玩转书生浦语大模型趣味 Demo B站教程:轻松玩转书生浦语大模型趣味 Demo 1. 笔记 2.基础作业 2.1 作业要求 2.2 算力平台 2.3 新建demo目录,以及新建目录下的文件,下载模型参数 2.4 Intern…

异常处理过程和范例

目录 异常定义 异常关联 异常捕获与处理 查询 emp 数据表中工作岗位是 MANAGER 的员工信息,如果不存在这个员工,则输出“没有数据记录返回”,如果存在多个记录,则输出“返回数据记录超过一行” 更新数据表 emp 中部门编号&am…

Proxmox VE qm 方式备份虚拟机

前言 使用qm 备份Proxmox VE虚拟机,高效便捷。 登录Proxmox VE shell 执行备份操作 备份建议关闭虚拟机 qm shutdown 虚拟机名称号--compress 备份格式 0(代表vma格式) gzip lzo zstd--storage local(备份的位置)备份默认位置/var/lib/…

1130 - Host ‘36.161.238.56‘ is not allowed to connect to this MySQL server如何处理

1、背景 我在阿里云的ecs安装好了mysql,并且已经安装成功了,我使用navcat客户端连接自己的mysql的时候,却报错:1130 - Host 36.161.238.56 is not allowed to connect to this MySQL server 2、解决 2.1 在服务器终端使用命令行…

Savitzky-Golay滤波器基本原理

本文介绍Savitzky-Golay滤波器基本原理。 Savitzky-Golay滤波器(简称为S-G滤波器)被广泛地运用于数据平滑去噪,它是一种在时域内基于局域多项式最小二乘法拟合的滤波方法。这种滤波器最大的特点在于在滤除噪声的同时确保信号的形状&#xff…

基于Web的农产品销售管理系统

1 课题简介 1.1 选题背景 自宇宙出现盘古开天依赖,万事万物就在不断的进步更新淘汰弱者,现在到了如今人们进入了互联网上帝世纪,越来越多的事物和工作都可以在网上用数据流代替和执行,不必再像以前一样亲自出面和出门做事&#…

文件上传 = 拖拽 + 多文件 + 文件夹

❝ 从前往后看都是努力,从后往前看都是命运 ❞ 大家好,我是「柒八九」。一个「专注于前端开发技术/Rust及AI应用知识分享」的Coder 前言 今天呢,和大家聊点耳熟能详的东西。「文件上传」。 讲到这里,大家不要嗤之以鼻,…

【必看】网络安全从业者书单推荐

推荐几本网络安全从业者必读的书籍 一、计算机基础 《网络硬件设备完全技术宝典》(第3版) 本书共768页,包括交换机、路由器、安全设备、网络设备等重要和常用的网络设备,图文并茂,语言流畅,内容及其丰富…

linux网络服务学习(6):多路径multipath解决iscsi多网卡识别错误问题

1.什么是多路径 1.1路径 物理层面一条数据的访问通道 访问方式: (1)以太网卡双绞网线以太网交换机 (2)HBA光纤卡光纤线光纤交换机 访问过程: (1)冗余链路failover&#xff1a…

java 23种设计模型讲解跟实例

java 23种设计模式讲解跟实例 什么是设计模式设计模式分类六大设计原则 创建型模式单例模式(singleton)工厂方法模式建造者模式抽象工厂模式原型模式 结构型模式适配器模式桥接模式组合模式装饰模式外观模式享元模式代理模式 行为型模式责任链模式命令模…

从零开始学Python(五)面向对象

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于Python的相关操作吧 目录 🥳🥳Welcome Huihuis Code World ! !🥳🥳 一.类的定义 二.魔法方法 1.概念 2.常…

RabbitMQ-canal 监听本地数据库 -收不到消息解决方法

一、当我们配置好canal 的配置文件后 发现log 日志不报错,但是消息队列就是监听不到数据库的消息。 二、解决方法 在mysql 的ini 配置文件中加入下列代码 connect_timeout60 # 将默认值(如30秒)改为60秒 wait_timeout28800 # 将空闲连接超时…

安防视频监控/视频集中存储EasyCVR平台开启鉴权后设备列表不展示是为什么?

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,EasyCVR基于云边端一体化架构,具有强大的数据接入、处理及分发能力,可提供视频监控直播、云端录像、云存储、录像检索与回看、智能告警、平台级联、…