Anthropic 发布了 Claude 3 系列,包含了三款模型
各具特色,旨在为用户提供更智能、更快速、更高效的选择,可以说是是迄今为止最快、最强大的人工模型!
Anthropic 一度是 OpenAI 最强力的竞争对手!
随着 Claude3 的发布,已经在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准,超过 GPT-4
没有所谓的发布会,没有什么华丽的舆论,就仅仅在X上发了个帖子。
我发现现在的这些AI公司真挺有意思,都把X当成发布主阵地了。。。
字很少,但是事挺大。
一口气发了3个模型,Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku
主要特点
-
新高度:Opus 模型在 AI 评估基准上表现突出,处理复杂任务如同轻松闲庭信步。
-
多语言:Claude 3 系列能够流畅地处理西班牙语、日语、法语等多种语言的对话和文本分析。
Claude 3 系列在 专家知识 (MMLU)、研究生水平专家推理 (GPQA)、基础数学 (GSM8K) 等 领域都超过了同行!
实实在在的拉高了整个行业的标准!
在复杂任务上表现出接近人类水平的理解力和流畅性,引领通用智能的前沿。
同样在 分析和预测、细致内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面能力也是拉满!
突破性能力
即时反应:Claude 3 系列支持实时响应,特别是 Haiku 模型,速度快、成本低。
视觉识别:这些模型能够识别并处理多种视觉格式,如照片、图表和技术图纸。
减少错误拒绝:Claude 3 模型在理解边缘性提示方面取得显著进步,减少不必要的拒绝回答。
准确率提升:在处理复杂问题时,这些模型表现出更高的准确性,减少错误信息的产生。
长期记忆:最初提供 200K token 的上下文窗口,能够有效处理长篇输入,Opus 模型在信息回忆方面表现尤为出色。
测评
解释补集法的概念,并用补集法计算这道概率题:"一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?"
张三是一名推销员,她在绿房子卖掉了三分之一的吸尘器,在红房子多卖了 2 台,在橙房子卖掉了剩下吸尘器的一半。如果张三还剩下 5 台吸尘器,她一开始有多少台吸尘器?
还可以直接上物理题,直接传图就行。全对
放个科学示意图的Case,还是很强的
总体来说,很惊艳,对于中文支持更好了,推理能力一流!
现在压力来到了OpenAI这边了
最后再来看看价格
Claude Opus
特点:Opus 模型是目前市场上最智能的模型,擅长处理极其复杂的任务。它能够流畅应对开放式问题和全新场景,显示出类似人类的高度理解能力。
成本:输入 $15/百万 token,输出 $75/百万 token- 上下文窗口:200K token
应用场景:包括任务自动化、研发、策略分析等
优势:在智能层面,超越其他所有模型
Claude Sonnet
特点:Sonnet 模型在智能与速度之间找到了完美的平衡点,特别适合承担企业级任务,性价比高
成本:输入 $3/百万 token,输出 $15/百万 token- 上下文窗口:200K token
应用场景:适用于数据处理、销售支持、提升工作效率等任务
优势:与同等智能模型相比,更经济实惠,适合大规模部署
Claude Haiku
特点:Haiku 模型反应迅速,是所有模型中最快的,特别适合需要即时反应的简单任务
成本:输入 $0.25/百万 token,输出 $1.25/百万 token- 上下文窗口:200K token
应用场景:客户服务、内容审核、优化物流等
优势:在速度和成本效益上领先,为用户提供高效的 AI 体验
再来看看 GPT4 的价格
GPT4: 输入 $30/百万 token, 输出 $60/百万token
GPT4-32k: 输入 $60/百万 token, 输出 $120/百万token
这… 在价格上又被压一头!
这一下好了,全网都在等 GPT-5 了
最后推荐一个超棒的社群,一起提升,还能领取副业资料