新火种AI|Claude 3.5一夜封王超越GPT-4o!留给OpenAI的时间真的不多了...

news2024/11/28 22:35:55

AI大模型更新换代的速度,的确快到令人难以想象。

相信很多人现在对“最先进AI大模型”的印象还停留在GPT-4,但事实上,大模型领域的头把交椅早已悄然易主了好几回。就在GPT-4惊艳全球不久之后,其“死对头” Anthropic发布了Claude 3系列,瞬间将GPT-4拉下了神坛。随后,OpenAI发布了GPT-4o,又暂时抢回来了属于自己的领先地位。

但如今,OpenAI不得不再次面临严峻挑战。就在最近,Anthropic发布了Claude 3.5 Sonnet,不仅较先前版本各方面性能都有了质的提升,还又一次将GPT-4o按在地上摩擦。

Claude 3.5 Sonnet昨夜震撼上线!性能更突出,价格更便宜,直接吊打GPT-4o。

6月20日深夜,Anthropic突然发布了下一代旗舰大模型Claude 3.5 Sonnet。

那么,Claude 3.5 Sonnet究竟惊艳在哪里呢?

首先,跟自己上一版本中最强的Claude 3 Opus相比,Claude 3.5 Sonnet不仅速度提升了200 %,其成本还直接降低了80 %,性价比直接拉满

此外,Claude 3.5 Sonnet拥有最强视觉模型,在所有标准测试中,均超越了前代Claude 3 Opus。

更重要的是,Claude 3.5 Sonnet不仅跟自己比才厉害,其各项性能和效率也遥遥领先于GPT-4o。

尤为值得一提的是,Claude官网上还推出新功能——Artifacts 预览版。说白了,这就是创建了一个动态工作区。用户可以通过Claude生成文档,代码,矢量图,或是简单的游戏。而Artifacts则可以出现聊天界面旁边,这样用户能够实时查看,迭代和创建自己的作品。外界认为,Artifacts 预览这一功能的出现,标志着Claude将从对话式 AI 进化为协作式工作环境

目前,Claude 3.5 Sonnet 已经在 Claude.ai 和 Claude iOS 应用程序上免费提供,而 Claude Pro 和 Team 计划订户则可以享受更高速率。此外,Claude 3.5 Sonnet 还可以直接通过 Anthropic API,亚马逊云科技 Bedrock 等渠道使用。

除了在性能上全面碾压,其价格也明显低于GPT-4o。

如今,Claude 3.5 Sonnet已经面向全球开启免费试用了。在费用上,Sonnet处理每百万输入token仅需3美元,每百万输出token仅为15美元。对比之下,GPT-4o的每百万输入token收费5美元,每百万输出token为15美元。

压力给到了OpenAI:GPT-5何时能问世?

对于Anthropic此次发布的新产品,外界普遍持有肯定的态度

前OpenAI对齐团队负责人Jan Leike就表示,自己很喜欢喜欢Sonnet新模型。他提到,自己会要求Sonnet解释ML论文。虽然不一定全对,但会比自己粗读略读的结果要好,速度也快得多。可以说,自动对齐的研究距离我们越来越近了。

Anthropic的产品经理Michael Gerstenhaber则直接将自己公司的新模型称之为“世界上最智能的模型”。他表示,“我们正处于这个行业寒武纪大爆发的开端”。而更加先进的Claude 3.5 Haiku和最强版Claude 3.5 Opus会在今年晚些时候陆续推出。由此可见,各大模型厂商们是彻底卷起来了,竞争也越来越激烈。

而好奇的网友们也在Claude 3.5 Sonnet发布的第一时间上手测评。大家发现,Sonnet写代码的速度着实惊人。有的网友仅仅通过一次对话,就用threejs+cannonjs创建出一个3D太阳系模型,包含了物体和碰撞效果。还有网友认为,使用Claude 3.5 Sonnet进行编码的效率比其他任何大型语言模型都要高,还可以达到GPT-4的10倍。特别是在全新的Artifacts功能的加持下,用户可以边聊天边生成和运行代码,简直令人惊叹。还有网友借助Sonnet力量,在不到2分钟的时间里做出了一个戴着太阳镜的小狗吃骨头的游戏。

正如前面提到的那样,Claude 3.5引入的超强实时交互功能Artifacts,毫无疑问,这一亮点开启了交互式AI最有潜力的形式。它标志着Claude从对话式AI向协作工作环境的转变,而在不久的未来,Anthorpic还会设想整个组织都能在共享空间中集中知识,文档以及工作,而Claude会随时提供服务。

Claude 3.5 Sonnet表现如此出色,很多网友戏言:压力直接给到OpenAI了。毕竟,如果今年年底GPT-5再不发布,OpenAI被中美两国的大模型迅速赶超这件事将会成为不争的事实。

即便GPT-5如期而至,大家也会担忧,相较GPT-4,新一版的推理能力会不会显著提高?现在硅谷坊间盛传,一次显著的性能提升至少要依靠10万张,乃至20万,30万张GPU卡。在这种情况下,OpenAI是否会有足够的GPU卡来训练高质量数据?就目前来看,这一切都是未知数。

Anthropic与OpenAI之间再添新仇!两大AI独角兽公司之间的较量愈演愈烈...

大家对Claude和GPT之间的角力如此关注,这其中有一个很关键的因素,那就是大模型比拼背后潜藏的,是Anthropic与OpenAI之间的“爱恨情仇”。

就在今年5月,也就是Claude 3 Opus强势上线的时候,Anthropic的创始人Dario Amodei和Daniela Amodei(二人是兄妹)就对OpenAI展开了暗戳戳的“嘲笑”,称Anthropic的人工智能是世界上最好的。他们表示,Claude 3 Opus是世界上最强大的人工智能模型(在当时) 。

Amodei兄妹曾是OpenAI的前员工。2020年6月,就在OpenAI发布第3代大语言模型GPT-3的半年之后,负责OpenAI研发的研究副总裁Dario Amodei和安全政策副总裁Daniela Amodei决定离职。究其原因,是因为他们对当时OpenAI管理层的理念和政策不甚认同,在价值观上存在着严重的偏差。离职后,他们创建了一家专注于安全的人工智能公司,即Anthropic。

值得一提的是,Anthropic的创始团队其实就是GPT系列产品的早期开发者,这也是他们后来所推出的Claude系列可以与GPT系列想抗衡的重要原因。

Anthropic团队有一个很明确的目标,就是构建一套“可靠,可解释,可控”的以人类(利益)为中心的人工智能系统。

事实上,这些关键词是OpenAI的昔日愿景。但在2019年之后,尤其是OpenAI接受了微软100亿美元的投资之后,愿景与现实起了冲突。如今,Amodei兄妹重拾了老东家的愿景,并研发出了更为智能的AI大模型,直接站在了老东家的对立面,成为其名副其实的竞争对手。

如今3年过去了,Anthropic拥有7名联合创始人,发展稳定,业务蒸蒸日上,还与谷歌,亚马逊之间展开了价值数十亿美元的合作关系。反观OpenAI,却在过去的几个月里损兵折将:创始成员Andrej Karpathy在2月份离开了 OpenAI,联合创始人 Ilya Sutskever前段时间官宣离职等核心成员离职的事情不断发生。

毫无疑问,这两大AI独角兽公司未来的竞争会日趋白热化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1851246.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大模型自然语言生成自动驾驶可编辑仿真场景(其一 共十篇)

第一篇:LLM greater scene summarize 第二篇:LLM simulation Test effect 第三篇:LLM simulation driving scenario flow work 第四篇:LLM Algorithm flow description 第五篇:Configure the environment and back…

【CSS in Depth2精译】1.4 简写属性

文章目录 1.4 简写属性1.4.1 当心简写属性悄悄覆盖其他样式1.4.2 记住简写值的顺序1 上、右、下、左顺序2 先水平、再垂直的顺序 1.4 简写属性 简写属性(Shorthand properties) 是可以一次性设置多个属性值的样式属性。例如, font 就是一个简…

大模型产品化第一年​:战术、运营与战略

作者 | Eugene Yan、Bryan Bischof等 OneFlow编译 翻译|宛子琳、张雪聃、杨婷 题图由SiliconCloud平台生成 这是一个激动人心的时代,所有人都能够利用语言大模型(LLM)进行各种各样的产品构建。 过去一年里,LLM已经达到…

Apple - Advanced Memory Management Programming Guide 内存管理

翻译整理自:Advanced Memory Management Programming Guide(Updated: 2012-07-17 https://developer.apple.com/library/archive/documentation/Cocoa/Conceptual/MemoryMgmt/Articles/MemoryMgmt.html#//apple_ref/doc/uid/10000011i 文章目录 一、关于…

Mac OS 如何在命令行下启动Docker

现象 当用 Mac air作为服务器时,远程登录上去后想使用 docker,却报如下错: Cannot connect to the Docker daemon at unix:///Users/aborn/.docker/run/docker.sock. Is the docker daemon running? 原因分析 因为 docker 有一个守护进程…

WebSocket走私实践(附赠LiveGBS监控系统未授权管理员密码重置)

WebSocket走私实践(附赠LiveGBS监控系统未授权管理员密码重置) 对此,我特别感谢TryHackMe和HackTheBox academy,永远相信和追随英国TryHackMe所教导的网络安全知识,并保持学习 WebSocket走私相关的知识在这里 前段时间学习过htt…

关于小程序内嵌H5页面交互的问题?

有木有遇到?有木有遇到。 小程序内嵌了H5,然后H5某个按钮,需要打开小程序某个页面进行信息完善或登记,登记后要返回H5页面,而H5页面要动态显示刚才在小程序页面登记的信息。 操作流程是这样: 方案1&#…

一般人不要学Python?一般人怎么学Python!!

关于“建议一般人真的不要学Python”这一观点,我认为这是一个过于绝对的说法。实际上,Python作为一种流行的编程语言,具有许多优点,适合不同背景和需求的人学习。以下是一些反驳这一观点的理由: 易于学习和理解&#x…

学习笔记——路由网络基础——动态路由

五、动态路由 1、动态路由概述 动态路由:通过在设备上运行某种协议,通过该协议自动交互路由信息的过程。 动态路由协议有自己的路由算法,能够自动适应网络拓扑的变化,适用于具有一定数量三“层设备的网络。 动态路由协议适用场…

C++ 89 之 string查找和替换

#include <iostream> #include <string> using namespace std;int main() { // int find(const string& str, int pos 0) const; //查找str第一次出现位置,从pos开始查找 // int find(const char* s, int pos 0) const; //查找s第一次出现位置,从pos开始查找…

【吊打面试官系列-Mysql面试题】什么是存储过程?用什么来调用?

大家好&#xff0c;我是锋哥。今天分享关于 【什么是存储过程&#xff1f;用什么来调用&#xff1f;】面试题&#xff0c;希望对大家有帮助&#xff1b; 什么是存储过程&#xff1f;用什么来调用&#xff1f; 答&#xff1a;存储过程是一个预编译的 SQL 语句&#xff0c;优点是…

Flutter-实现头像叠加动画效果

实现头像叠加动画效果 在这篇文章中&#xff0c;我们将介绍如何使用 Flutter 实现一个带有透明度渐变效果和过渡动画的头像叠加列表。通过这种效果&#xff0c;可以在图片切换时实现平滑的动画&#xff0c;使 UI 更加生动和吸引人。 需求 我们的目标是实现一个头像叠加列表&…

2024信友队春季 Day3 二分分治

二分 & 分治 二分 二分查找 也叫折半搜索&#xff0c;用于在一个有序数组中查找某一元素的算法。 给定一个长度为 n n n 的从小到大排列的数列 a a a 和 q q q 次询问&#xff0c;每次询问给定 x x x&#xff0c;查找 x x x​ 在数列中的位置。 n , q ≤ 1 0 6 n,q\…

【机器学习】大模型驱动下的医疗诊断应用

摘要&#xff1a; 随着科技的不断发展&#xff0c;机器学习在医疗领域的应用日益广泛。特别是在大模型的驱动下&#xff0c;机器学习为医疗诊断带来了革命性的变化。本文详细探讨了机器学习在医疗诊断中的应用&#xff0c;包括疾病预测、图像识别、基因分析等方面&#xff0c;并…

cherry 笔记三(启动)

cherry启动很简单 app创建完 直接startup()就好了 func main() {app : cherry.Configure("./examples/config/profile-chat.json","chat-master",false,cherry.Cluster,)app.SetSerializer(cserializer.NewJSON())app.Startup() } Configure()--->N…

深入理解RunLoop

RunLoop 是 iOS 和 OSX 开发中非常基础的一个概念&#xff0c;这篇文章将从 CFRunLoop 的源码入手&#xff0c;介绍 RunLoop 的概念以及底层实现原理。之后会介绍一下在 iOS 中&#xff0c;苹果是如何利用 RunLoop 实现自动释放池、延迟回调、触摸事件、屏幕刷新等功能的。 一…

01_01_Mybatis的介绍与快速入门

一、数据持久层框架的发展历程 1、JDBC JDBC&#xff08;Java Data Base Connection&#xff09;&#xff0c;是一种用于执行SQL语句的Java API&#xff0c;为多种关系型数据库提供了统一访问的方式&#xff0c;它由一组用Java语言编写的类和接口组成。JDBC提供了一种规范&…

meterpeter基础及永恒之蓝漏洞利用

meterpeter基础知识 meterpeter为渗透测试框架&#xff0c;主要用于后渗透模块 后渗透&#xff1a;拿到shell后进行的操作&#xff08;远程&#xff0c;权限维持&#xff0c;入侵痕迹清除&#xff0c;上机关闭杀毒软件&#xff09; msf能干什么 相当于一个漏洞库&#xff08…

时序预测 | Matlab基于Transformer多变量时间序列多步预测

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab基于Transformer多变量时间序列多步预测&#xff1b; 2.多变量时间序列数据集&#xff08;负荷数据集&#xff09;&#xff0c;采用前96个时刻预测的特征和负荷数据预测未来96个时刻的负荷数据&#xff1b; 3…

【大数据离线项目三:将HIve数仓中的dim进行拉宽聚合处理,PostgreSQL的使用,以及怎么将数据导出到PostgreSQL数据库中】

前言&#xff1a; &#x1f49e;&#x1f49e;大家好&#xff0c;我是书生♡&#xff0c;今天主要和大家分享一下将HIve数仓中的dim进行拉宽聚合处理&#xff0c;PostgreSQL的使用&#xff0c;以及怎么将数据导出到PostgreSQL数据库中,希望对大家有所帮助。 &#x1f49e;&…