全球领先的人工智能研究公司 Anthropic 宣布推出 Claude 3.5 Sonnet,这是一款集无与伦比的性能和成本效益于一身的开创性人工智能模型。克劳德模型系列的最新迭代产品将彻底改变企业人工智能的格局,以低于竞争对手的成本为企业提供最先进的功能。
Anthropic 联合创始人 Daniela Amodei 在接受 VentureBeat 采访时谈到了此次发布的意义。"克劳德 3.5 Sonnet 现在是目前市场上能力最强、最智能、最便宜的机型,"Amodei 说。"在标准的七项智能和能力指标中,Claude 3.5 Sonnet 在其中六项上击败了所有竞争对手,在第七项上也相当接近。在标准视觉指标方面,我们在五项指标中的四项指标上名列前茅,在一项指标上紧随其后。
Anthropic 的 Claude AI 模型与 OpenAI 的 GPT 和谷歌的 Gemini 模型的发布时间和性能比较。今天发布的 Claude 3.5 Sonnet 在各种基准测试中的性能超过了 GPT-4o、Gemini 1.5 Pro 和旧型号,是 Anthropic 快速创新和以企业为中心战略的一个重要里程碑。(图片来源:Anthropic)
革新企业人工智能:Claude 3.5 Sonnet 的无与伦比的性能和经济性
Claude 3.5 Sonnet 的推出距 3 月份 Claude 3.0 的发布仅三个半月时间,彰显了 Anthropic 致力于快速创新的决心。"Sonnet3.5刚刚超越了我们的旗舰机型Opus,而我们的定价仅为Opus的五分之一,"Amodei透露。“我们之所以这样做,是因为我们听到了企业的反馈,他们关心质量、安全、可靠性、速度和成本。我们真正的目标是优先考虑这些方面。”
Anthropic对企业市场的关注使其有别于OpenAI等竞争对手,后者的GPT模型主要面向消费者。OpenAI 在推动人工智能能力发展方面取得了长足进步,而 Anthropic 则根据企业的具体需求量身定制产品,从而在市场上占据了一席之地。这种战略差异在 Claude 3.5 Sonnet 的功能和定价中显而易见,它优先考虑了对企业客户来说最重要的关键因素。
Claude 3.5 Sonnet 在各种基准测试中与其他领先人工智能模型的性能比较。它在研究生水平的推理、代码生成、多语言数学和小学数学等关键领域的表现优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。该模型的强劲表现彰显了 Anthropic 为企业客户提供尖端人工智能能力的承诺。(图片来源:Anthropic)
而在多模态的视觉能力上也基本达到了全面领先。除了视觉问答(MMMU)离GPT4o还查了小1个点之外,其他的4项:视觉数学推理 (MathVista)、 科学图表理解 ( AI2D)、图表问答、文档视觉问答 (ANLS),都达到了最佳水平。
Artifacts:实现业务团队的无缝协作
Claude 3.5 Sonnet 的突出功能之一是引入了 Artifacts,这是一款专为企业内部团队设计的协作工具。"Amodei说:"Artifacts允许团队调入大量信息,如法律公司的文档或案例文件,或营销机构的视觉资产和语气指南。"营销人员团队现在可以坐在一起,使用 Artifacts 与团队空间内的 Claude 共同开发一个项目。
虽然 Claude 3.5 Sonnet 擅长文本和图像输入,但 Anthropic 根据客户反馈做出了一项战略决策,即不优先考虑语音输入或输出。"阿莫迪说:"这并不是我们企业客户的首要要求。"我们可以想象,随着时间的推移,在客户支持等方面,人们能够进行电话呼入或呼出可能会有价值。这是我们正在考虑的长期产品路线图。