OpenAI劲敌出手!Claude 3正式发布,全面超越GPT-4。Claude3模型特点和使用教程分享

news2024/11/16 22:35:32

已有GPT官方账号不会升级GPT4请参考:【国内如何用gpt4?如何升级gpt4?保姆级教程】

一、Claude震撼发布焦点分析

1.Claude震撼发布

北京时间2024年3月4日晚间,Anthropic,毫无预警地发布了最新一代大模型Claude 3,距离上一代的Claude 2发布,仅相隔8个月。

Claude 发布了最新的大模型 Claude3,并且一次性发布了三个模型,分别是

  • Claude 3 Haiku:(日本俳句 )
  • Claude 3 Sonnet(英文十四行诗)
  • Claude 3 Opus(古典乐作品集)

Anthropic是OpenAI的劲敌,其核心团队同样是OpenAI的创业原班人马。团队因为与OpenAI理念不合而分家,于2021年成立了新公司Anthropic。

2.Claude评测指标全方面领先GPT4

官方列出的一张图表,分别从 编码,推理,数学,多语言,和文本理解上,基于现有的模型评测体系,全方面的和 GPT4进行了对比。

毫无疑问,Claude 3直接对标OpenAI当前最强大的模型GPT-4,多模态能力配齐,并且直接甩出超过46页的技术报告,自豪表示:

Anthropic指出:Opus是我们最智能的模型,在大多数人工智能系统的常见评估基准上都优于同行,包括**本科水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)**等等。它在复杂任务上表现出接近人类水平的理解和流畅性,引领着通用智能的前沿。

3.Claude 3的三款模型:Haiku、Sonnet、Opus

新一代的Claude 3分为三个版本,分别为Haiku、Sonnet、Opus三款模型

虽然Anthropic并没有给出模型的具体参数,不过给出了三款模型所适用的场景:

  • Haiku:是相应速度最快的模型,也是成本最低的选项,在大多数纯文本任务上的表现仍然相当出色,也同时包含多模态能力(比如视觉)
  • Sonnet:适用于需要平衡性能和成本的场景,它在纯文本任务上的表现与后面的Opus相当,但在成本上更为经济,适合于那些需要性能稍微好点,但预算有限的企业和个人用户
  • Opus:具有强大的推理、数学和编码能力,接近人类的理解能力,适用于需要高度智能和复杂任务处理的场景,如企业自动化、复杂金融预测、研究和开发等。

圈内人也看热闹不嫌事大。近期不少报道显示,马斯克将OpenAI告上法庭,让OpenAI不得不内部推迟有关GPT-5的发布——GPT-5被认为能够实现AGI(通用人工智能)。著名AI圈网红、英伟达的首席AI科学家Jim Fan就表示:

Claude 3刚刚发布了,坐等几个小时后OpenAI精心安排的GPT-5发布。

4.Claude 视觉能力强

从官方技术报告可以看到Claude3 Opus 的识别性能是和 GPT4这个我们认为最厉害的视频/图片理解模型是相当的,并且在 「Science Diagrams」上大幅领先 GPT4V

5.Claude 3两大更新亮点:长文本;多模态能力。

长文本:Anthropic的一个显著优势,体现为在读论文、小说等字数更多的文本时,Anthropic更擅长理解和回答用户的相关问题。

这次,Claude 3大大提升了上下文对话窗口,达到200k——可以理解为单次和模型对话能够输入的文本。

具体而言,Claude 3 200k的对话长度,相当于能够单次处理超过15万英文单词,而GPT-4 Turbo的上下文窗口为128k,大约是9.6万个英文单词。

官网提出了一个名字叫「Needle In A Haystack」 的评测方法,用来衡量从一大堆语聊数据中准确提取相关文本的能力(简单理解就是,只看和问题相关的信息,忽略不重要的信息)。

NIAH:通过每次提示使用 30 个随机针/问题对中的一个,并在不同的众包文档语料库中进行测试,增强了这一基准的稳健性。Claude 3 Opus 不仅实现了接近完美的召回率,准确率超过 99%,而且在某些情况下,它甚至能识别出 “针 “句似乎是人为插入原文的,从而识别出评估本身的局限性。

多模态:在Anthropic的演示视频里,就举了一个需要用python模拟经济形势走向的例子。当把“分析美国十年GDP未来趋势”的任务交给Claude 3之后,Claude就默默地做了这些事:

  • 先打开一个名为“webview”的工具,跳到这个问题相关的资料网址里
  • 因为有多模态能力,所以能够把“看到”的信息,无论是文字还是图表,都扒拉下来,用来解决问题
  • 然后自己写python程序、渲染趋势图,让人类看是否正确

有趣的就是,网页中如果看到一个数据图表,没有明确数据的,Claude 3甚至能通过识别图像,来估算每个阶段大概数据是多少,进行还原。

Claude官方技术报告:https://www.anthropic.com/news/claude-3-family

二、Claude 3如何使用

目前 Opus 和 Sonnet 都可以在官网使用了!https://www.anthropic.com/

Opus,和 GPT plus 一样,收费是 20 美元/月。目前Claude3 的升级和 Openai 一样,都不支持国内用户使用信用卡支付

关于如何升级Claude Opus 或者ChatGPT 4,请参考:【国内如何升级chatgpt4.0(Claude3)?用户最友好界面信用卡保姆级教程。】

优点

  • 支付安全:支持支付宝和微信支付,方式安全
  • 支持的服务非常齐全,支持claude, onlyfans, chatgpt, midjourney 等等很多软件的订阅使用
  • 快速响应:右下角人工客服快速响应,客服回复比较及时

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1568057.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RuoYi-Vue若依框架-集成mybatis-plus报错Unknown column ‘search_value‘ in ‘field list‘

报错信息 ### Error querying database. Cause: java.sql.SQLSyntaxErrorException: Unknown column search_value in field list ### The error may exist in com/ruoyi/sales/mapper/ZcSpecificationsMapper.java (best guess) ### The error may involve defaultParameter…

32-2 APP渗透 - 移动APP架构

前言 app渗透和web渗透最大的区别就是抓包不一样 一、客户端: 反编译: 静态分析的基础手段,将可执行文件转换回高级编程语言源代码的过程。可用于了解应用的内部实现细节,进行漏洞挖掘和算法分析等。调试: 排查软件错误的一种手段,用于分析应用内部原理和行为。篡改/重打…

【python实战】--提取所有目录下所有Excel文件指定列数据

系列文章目录 文章目录 系列文章目录前言一、问题描述二、python代码1.引入库 总结 前言 一、问题描述 需要提取指定路径下所有excel文件中指定一列数据,汇总到新文件,(逐列汇总) 二、python代码 1.引入库 代码如下&#xff08…

66toolkit终极网络工具系统:470+强大Web工具,助力您的网络运营与开发

一、产品介绍 66toolkit,被誉为“终极网络工具系统”(SAAS),是一款功能强大的PHP脚本。它集合了超过470种快速且易用的Web工具,为日常任务处理和开发人员提供了极大的便利。作为一款综合性的网络工具系统,…

【吊打面试官系列】Redis篇 -如果有大量的 key 需要设置同一时间过期,一般需要注意什么?

大家好,我是锋哥。今天分享关于 【如果有大量的 key 需要设置同一时间过期,一般需要注意什么?】面试题,希望对大家有帮助; 如果有大量的 key 需要设置同一时间过期,一般需要注意什么? 如果大量的…

ContEA论文翻译

Facing Changes: Continual Entity Alignment for Growing Knowledge Graphs 面对变化:不断增长的知识图谱的持续实体对齐 Abstract 实体对齐是知识图谱(KG)集成中一项基本且重要的技术。多年来,实体对齐的研究一直基于知识图谱是静态的假设&#xff…

基于Spring Boot的餐厅点餐系统

基于Spring Boot的餐厅点餐系统 开发语言:Java框架:springbootJDK版本:JDK1.8数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:Maven3.3.9 部分系统展示 管理员登录界面 用户注册登录界面 …

阿里云服务器安装Java开发环境最佳实践

服务器环境安装 环境依赖服务器配置配置SSH登录打开安全配置端口远程连接配置秘钥 Linux服务器常用指令向远程服务器传送文件systemctl 相关 安装MySql安装步骤step1 检查并清除以前的mysql相关文件step2 安装step3 MySQL参数配置step4 设置开机启动step5 初始化数据库step6配置…

DDD 的四层领域模型是怎样的?包含哪些基础概念?

DDD的四层领域模型如下所示: 展现层:这一层负责向用户显示信息和解释用户命令,完成前端界面逻辑。并将用户请求传递给应用层。应用层:这一层是很薄的一层,负责协调领域层中的领域对象,组成具体应用场景。应…

工厂制造细节无需知--工厂方法模式

1.1 需要了解工厂制造细节吗? "简单工厂只是最基本的创建实例相关的设计模式。但真实情况中,有更多复杂的情况需要处理。简单工厂生成实例的类,知道了太多的细节,这就导致这个类很容易出现难维护、灵活性差问题,…

python--IO流和字符流的写入写出

1.IO流:(input output stream) python的IO流只有一个函数:open函数 属性不用带括号;方法通通要带括号 输入输出流:狭义上来说,指的就是内存数据和磁盘这种可以永久 存储数据的设备 IO流 IO流…

LongAdder 和 Striped64 基础学习

cs,表示 Cell 数组的引用;b,表示获取的 base 值,类似于 AtomicLong 中全局变量的 value 值,在没有竞争的情况下数据直接累加到 base 上,或者扩容时,也需要将数据写入到 base 上;v&am…

计算机考研408有向无环图描述表达式可靠构造方法

目录 前言目标(以王道书为例)构造方法1. 建树2. 后序遍历1. a2. b3. 4. b5. c6. d7. 8. *9. *10. c 前言 对王道视频中的分层合并思想不是很满意,笔者提出自己的构造方法。 目标(以王道书为例) 构造方法 笔者通过王…

GitGithub小册:版本管理必备利器

在 GitHub上创建仓库 这一步骤的前提是先注册一个 GitHub的账号,由于那都是小场面,就不再巴拉巴拉。 说明一下,全文如果没有特别的单独说明,文中所有用【】括起来的内容都代表网页或者软件节点的操作按钮或者步骤选择项。 打开 Gi…

【QT入门】 自定义标题栏界面qss美化+按钮功能实现

往期回顾: 【QT入门】 鼠标按下和移动事件实现无边框窗口拖动-CSDN博客【QT入门】 设计实现无边框窗口拉伸的公用类-CSDN博客【QT入门】对无边框窗口自定义标题栏并实现拖动和拉伸效果-CSDN博客 【QT入门】 自定义标题栏界面qss美化按钮功能实现 一、最终效果 二、…

AI论文速读 |【综述】 时序分析基础模型:教程与综述

论文标题:Foundation Models for Time Series Analysis: A Tutorial and Survey 作者: Yuxuan Liang(梁宇轩), Haomin Wen(温浩珉), Yuqi Nie(PatchTST一作), Yushan Jiang, Ming J…

redis的常用基本命令与持久化

文章目录 redis的基本命令1.授权密码2.增加、覆盖、查询、删除、切换库名、移动、清空数据库 Redis持久化RDB模式主动备份自动备份RDB备份过程 AOF备份模式开启AOF备份模式执行流程 总结 redis的基本命令 1.授权密码 config set requirepass 密码设置完密码需要认证密码以后才…

最简单的 H.264 视频码流解析程序

最简单的 H.264 视频码流解析程序 最简单的 H.264 视频码流解析程序原理源程序运行结果下载链接参考 最简单的 H.264 视频码流解析程序 参考雷霄骅博士的文章:视音频数据处理入门:H.264视频码流解析 本文中的程序是一个H.264码流解析程序。该程序可以从…

​IAA+IAP混合变现趋势下,出海手游广告玩法解析 | TopOn出海干货

3月23日,TopOn 携手罗斯基及汇量科技旗下一站式跨渠道智能投放工具XMP联合主办的“2023游戏出海新机会”上海站线下沙龙成功举办。 本次活动邀请到多位业内知名公司、平台的负责人,分别从海外投放增长策略、产品融合玩法方向、商业混合变现模式、三方安…

C++万物起源:类与对象(三)拷贝构造、赋值重载

目录 一、拷贝构造函数 1.1拷贝构造函数的概念与特征 1.2拷贝构造的实现 1.3默认构造函数 1.4拷贝构造函数典型调用场景 二、赋值运算符重载 2.1赋值运算符重载的格式 一、拷贝构造函数 1.1拷贝构造函数的概念与特征 在c语言语法中,我们可以将一个变量赋值给…