Claude 3 模型发布，压力来到OpenAI这边了~

news2026/2/15 15:23:45

Anthropic 发布了 Claude 3 系列，包含了三款模型

各具特色，旨在为用户提供更智能、更快速、更高效的选择，可以说是是迄今为止最快、最强大的人工模型！

Anthropic 一度是 OpenAI 最强力的竞争对手！

随着 Claude3 的发布，已经在推理、数学、编码、多语言理解和视觉方面，都树立了新的行业基准，超过 GPT-4

没有所谓的发布会，没有什么华丽的舆论，就仅仅在X上发了个帖子。

我发现现在的这些AI公司真挺有意思，都把X当成发布主阵地了。。。

字很少，但是事挺大。

一口气发了3个模型，Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku

主要特点

新高度：Opus 模型在 AI 评估基准上表现突出，处理复杂任务如同轻松闲庭信步。
多语言：Claude 3 系列能够流畅地处理西班牙语、日语、法语等多种语言的对话和文本分析。

Claude 3 系列在专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等领域都超过了同行！

实实在在的拉高了整个行业的标准！

在复杂任务上表现出接近人类水平的理解力和流畅性，引领通用智能的前沿。

同样在分析和预测、细致内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面能力也是拉满！

突破性能力

即时反应：Claude 3 系列支持实时响应，特别是 Haiku 模型，速度快、成本低。

视觉识别：这些模型能够识别并处理多种视觉格式，如照片、图表和技术图纸。

减少错误拒绝：Claude 3 模型在理解边缘性提示方面取得显著进步，减少不必要的拒绝回答。

准确率提升：在处理复杂问题时，这些模型表现出更高的准确性，减少错误信息的产生。

长期记忆：最初提供 200K token 的上下文窗口，能够有效处理长篇输入，Opus 模型在信息回忆方面表现尤为出色。

测评

解释补集法的概念，并用补集法计算这道概率题："一家公司有两个部门，A部门3个男生，2个女生，B部门4个男生，6个女生，现在要派3个人去出差，要求每个部门至少出一人，那么至少有一个女生被派出的概率是多少？"

张三是一名推销员，她在绿房子卖掉了三分之一的吸尘器，在红房子多卖了 2 台，在橙房子卖掉了剩下吸尘器的一半。如果张三还剩下 5 台吸尘器，她一开始有多少台吸尘器？

还可以直接上物理题，直接传图就行。全对

放个科学示意图的Case，还是很强的

总体来说，很惊艳，对于中文支持更好了，推理能力一流！

现在压力来到了OpenAI这边了

最后再来看看价格

Claude Opus

特点：Opus 模型是目前市场上最智能的模型，擅长处理极其复杂的任务。它能够流畅应对开放式问题和全新场景，显示出类似人类的高度理解能力。
成本：输入 $15/百万 token，输出 $75/百万 token- 上下文窗口：200K token
应用场景：包括任务自动化、研发、策略分析等
优势：在智能层面，超越其他所有模型

Claude Sonnet

特点：Sonnet 模型在智能与速度之间找到了完美的平衡点，特别适合承担企业级任务，性价比高
成本：输入 $3/百万 token，输出 $15/百万 token- 上下文窗口：200K token
应用场景：适用于数据处理、销售支持、提升工作效率等任务
优势：与同等智能模型相比，更经济实惠，适合大规模部署

Claude Haiku

特点：Haiku 模型反应迅速，是所有模型中最快的，特别适合需要即时反应的简单任务
成本：输入 $0.25/百万 token，输出 $1.25/百万 token- 上下文窗口：200K token
应用场景：客户服务、内容审核、优化物流等
优势：在速度和成本效益上领先，为用户提供高效的 AI 体验
再来看看 GPT4 的价格

GPT4: 输入 $30/百万 token，输出 $60/百万token
GPT4-32k: 输入 $60/百万 token，输出 $120/百万token
这… 在价格上又被压一头！

这一下好了，全网都在等 GPT-5 了

最后推荐一个超棒的社群，一起提升，还能领取副业资料