2024年,搞AI就别卷模型了

news2025/1/11 5:40:53

你好,我是三桥君

2022年11月30日,OpenAI发布了一款全新的对话式通用人工智能工具——ChatGPT

该工具发布后,仅用5天时间就吸引了100万活跃用户,而在短短2个月内,其活跃用户数更是飙升至1亿,成为历史上增长速度最快的消费者应用程序!

什么概念?

就连国际版抖音TikTok达到1亿用户都用了9个月,而Instagram则花了两年半的时间。

想要深入了解AI,可以看我写的这篇文章:

《为什么要了解AI?突破》

Al曾经因为商业化的难题而受到外界的批评,但是随着OpenAl的ChatGPT的推出,它成为了搅动AI大模型领域的催化剂。突然之间,各种竞争者纷纷加入这场竞赛。

可以说就在一夜之间,AI大模型热得发烫。

百度率先加入战局,凭借“文心一言”抢占了与ChatGPT对标的“国内第一”位置,自此之后,大模型成为了市场的关注焦点。

特别是在那之后,各个领域的竞争者都开始全力以赴,迅速行动起来,密集地投入到这场竞争中,全力以赴地推动大模型的发展!可以说真的“卷”!

总之,大模型领域,彻底火起来了。

百度率先发起挑战,紧随其后的是阿里和商汤,它们都迅速跟进,并且是最为积极和迅速的,都已经推出了类似ChatGPT的产品。

以下是从2023年以来的一些大模型创业公司及产品:

  1. 复旦大学正式发布“MOSS”大模型

  2. 澜舟科技正式发布“MChat”

  3. 清华大学开启内测中英双语对话模型“ChatGLM-6B”

  4. 百度正式发布“文心一言”

  5. 商汤科技正式发布“日日新”

  6. 阿里巴巴正式发布“通义千问”

  7. 昆仑万维等正式发布“天工3.5”

  8. 科大讯飞发布了 “星火认知大模型”

  9. 美图正式发布视觉大模型“MiracleVision(奇想智能)”

  10. 华为正式发布“盘古大模型3.0”

  11. 字节跳动开始公测大语言模型“云雀大模型”

  12. 腾讯正式发布自研通用大语言模型 “混元”

......

可以说,在大模型领域,国内已经经历“百模大战”的时代了。

感兴趣的话,具体可以看我写的这篇文章:

《为什么要了解AI?风口》

三桥君认为,搞AI还是别卷大模型了。

为什么我会这么说呢?

因为群雄逐鹿,最后会是一将功成万骨枯。 胜利者,只是活下来的罢了。

这种战况局面让我联想到以前的“千团大战”。

在2010年至2015年期间,中国互联网领域经历了一场声势浩大的“千团大战”。这场竞争中,团购网站的数量从顶峰时期的5600家急剧减少至仅剩两家。在这五年的激烈角逐中,可以说美团才是最后的赢家。

训练大模型,成本非常高昂,动不动就上亿元起步,而且很耗能源。

训练大模型成本有多高呢?

2017年,训练一个基础的Transformer模型大约需要900美元。然而,到了2019年,训练一个RoBERTa Large模型的成本已经上升到了大约160000美元。进一步到了2023年,OpenAI的GPT-4模型和Google的Gemini Ultra模型的训练成本更是分别高达约7800万美元和近2亿美元!

不跟你开玩笑,训练大模型的成本是越来越贵~

训练大模型耗电有多高呢?

以GPT-3的训练为例,训练过程使用了大约128.7万度的电力。

该如何理解这个耗电量?

这相当于约6400户中国普通家庭一个月的电能消耗。有专家做过一个形象的比喻,这大致等同于3000辆特斯拉电动汽车同时行驶,每辆车行驶20万英里。

因此,三桥君认为,2024年,如果要搞AI还是别卷大模型了。除非你有这个资本去打持久战,否则大概率最后一地鸡毛。

也许我与大佬们在这件事上达成了共识。

2024年7月,知名大型AI峰会召开。其中,某大厂创始人站出来呼吁各位,“大家不要卷模型,要卷应用!

因为训练大模型真的耗钱耗能源,卷模型只会加剧。

那为什么劝大家卷应用呢?

因为将这些技术应用于实际场景,解决实际问题。就算没活下来,我认为至少给咱老百姓做贡献了,当福利了嘻嘻~

所以,AI的应用层应该会迎来一波小浪潮。如果你对AI应用感兴趣,可以学学这个内容。

《零基础开发AI聊天机器人》

欢迎订阅课程专栏:

《零基础开发AI聊天机器人》
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1921684.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

牛顿黏滞定律

牛顿黏滞定律描述了流体内部的剪切应力与速度梯度之间的关系。公式如下: τ η d v x d y \tau \eta \frac{dv_x}{dy} τηdydvx​​ 其中: τ \tau τ 是剪切应力(shear stress),单位是帕斯卡(Pa&…

互信息(Mutual Information,MI)的原理和计算

互信息(Mutual Information,MI)是信息论中的一个度量,用于量化两个随机变量之间的依赖关系。互信息度量了一个随机变量包含了关于另一个随机变量的信息量。它可以用来识别和量化两个信号之间的非线性相关性。互信息可以揭示两个信…

Web开发:一个可拖拽的模态框(HTML、CSS、JavaScript)

目录 一、需求描述 二、实现效果 三、完整代码 四、实现过程 1、HTML 页面结构 2、CSS 元素样式 3、JavaScript动态控制 (1)获取元素 (2)显示\隐藏遮罩层与模态框 (3)实现模态框拖动效果 一、需求…

【离线查询 堆 优先队列】1383. 最大的团队表现值

本文涉及知识点 离线查询 堆 优先队列 算法与数据结构汇总 LeetCode1383. 最大的团队表现值 给定两个整数 n 和 k,以及两个长度为 n 的整数数组 speed 和 efficiency。现有 n 名工程师,编号从 1 到 n。其中 speed[i] 和 efficiency[i] 分别代表第 i 位…

开源项目的认识理解

目录 开源项目有哪些机遇与挑战? 1.开源项目的发展趋势 2.开源的经验分享(向大佬请教与上网查询) 3.开源项目的挑战 开源项目有哪些机遇与挑战? 1.开源项目的发展趋势 1. 持续增长与普及 - 开源项目将继续增长&#xff0c…

软件测试——AI快速入门

工作职责: 1.负责产品系统测试,包括功能测试、性能测试、稳定性测试、用户场景测试、可靠性测试等。 2.负责测试相关文档的编写,包括测试计划、测试用例、测试报告等。 3.负责自动化测试框架、用例的维护。 岗位要求: 1.熟练…

编程范式之并发编程

目录 前言1. 并发编程的定义2. 并发编程的特点2.1 任务交替执行2.2 状态共享与同步2.3 并行执行 3. 并发编程的适用场景3.1 高性能计算3.2 I/O 密集型应用3.3 实时系统 4. 并发编程的优点4.1 提高资源利用率4.2 缩短响应时间4.3 提高系统吞吐量 5. 并发编程的缺点5.1 编程复杂性…

MP4怎么转为MP3?超多人都在用的四种转换方法!

MP4怎么转为MP3?MP4,这一风靡全球的多媒体容器格式,无疑是数字时代的一枚璀璨明珠,深深烙印在每个人的数字生活之中,那么,它究竟是如何在众多格式中脱颖而出,赢得如此广泛认可的呢?首…

【Redis】初识 Redis

文章目录 1 什么是 Redis2 Redis 的特点2.1 速度快2.2 可编程性2.3 可拓展性2.4 持久化2.5 主从复制2.5 高可用和分布式2.6 客户端语言多 3 Redis 使用场景3.1 实时数据存储3.2 缓存和 Session 存储3.3 消息队列 4 Redis 重大版本5 CentOS7 安装 Redis5 1 什么是 Redis Redis …

【typedb】例子:药物发现 1: 模式导入

typedb-examples/drug-discovery/ Drug discovery监听0.0.0.0:1729 但这么连接肯定不行: localhost:1729 可以: 一直无法点击schema图标:先创建一个数据库 选中数据库: 选中后就可以了:

分布式存储快速入门HDFS

分布式存储快速入门 文章目录 分布式存储快速入门一、概要介绍1.1 什么是分布式存储1.2 分布式存储的重要性和应用场景 二、HDFS基础2.1 HDFS的起源和发展2.2 HDFS的架构2.3 HDFS的基本概念2.4 HDFS的特性2.5 HDFS的版权 三、HDFS安装与配置3.1 环境准备3.2 安装Hadoop和配置HD…

你也想做一个Element-ui吧!!!——Blueの前端路(一)

目录 前言: 父子组件 button组件 使用vue脚手架初始化一个项目 如何封装,注册和使用一个组件 main.js中将组件设置为全局 使用 此组件我们所需实现的内容 type 父组件组件传递type属性 子组件接收负组件传递的数据 通过绑定类名的方法动态控制…

python如何结束程序运行

方法1:采用sys.exit(0),正常终止程序,从图中可以看到,程序终止后shell运行不受影响。 方法2:采用os._exit(0)关闭整个shell,从图中看到,调用sys._exit(0)后整个shell都重启了(RESTAR…

关键路径-matlab

路径上边的数目称为路径长度 图的基本知识 求最短路径(Dijkstra算法) 2. 待继续尝试 ①Dijkstra ②floyd_all.m 一 二 ③ LeetCode [329. 矩阵中的最长递增路径]

OpenCV solvePnP位姿估计

目录 一、概述 二、实现代码 2.1solvePnP函数 2.1.1输入参数 2.1.2输出参数 2.2完整代码 三、实现效果 3.1标定板位姿 3.2标定板到相机的变换矩阵 一、概述 完成相机标定后,可以通过检测标定板在图像中的位置来计算标定板在相机坐标系下的位姿(…

Python基础知识——(004)

文章目录 P16——15. 布尔类型 P17——16. 类型转换函数 P18——17. eval函数 P19——18. 算数运算符 P20——19. 赋值运算符 P16——15. 布尔类型 布尔类型 用来表示 “真” 值或 “假” 值的数据类型在Python中使用标识符 True 或 False 表示布尔类型的值True表示整数1&…

python的集合

定义 集合(是一个无序的、不包含重复元素的集合。集合对象支持数学上的标准集合操作,如并集、交集、差集等。) 创建集合 添加元素 删除元素 遍历 其他 union() 或 |:返回两个集合的 并集intersection() 或 &:返回…

关于共享盘(文件夹)

1、创建共享文件夹或共享盘 对应文件或盘-》右键-》属性-》共享或高级共享 2、设置权限来针对不同的用户进行访问 2.1 关于用户的添加 电脑->计算机管理->添加用户和组 2.2 本地用户 在属性的安全之中,可针对不同的用户和组进行权限设置,例如某…

MYSQL--第七次作业

MYSQL–第七次作业 在product表上创建三个触发器。每次激活触发器后,都会更新operate表。product表和表的内容如下 Product表内容 字段名 字段描述 数据类型 主键 外键 非空 唯一 自增 Id 产品编号 Int(10) 是 否 是 是 否 Name …

iPad锁屏密码忘记怎么办?有什么方法可以解锁?

当我们在日常使用iPad时,偶尔可能会遇到忘记锁屏密码的尴尬情况。这时,不必过于担心,因为有多种方法可以帮助您解锁iPad。接下来,小编将为您详细介绍这些解决方案。 一、使用iCloud的“查找我的iPhone”功能 如果你曾经启用了“查…