要想赚钱,AI模型该大该小?贾扬清:论AI模型经济学的技巧

news2025/1/6 19:08:20

卖模型就像感恩节卖火鸡,快才能赚钱。

最近的AI社区,关于模型规模的讨论有些活跃。

一方面,此前在大模型开发奉为“圣经”的Scaling Law,似乎正在褪去光环。去年大家还在猜测GPT-5的规模“可能会大到想不到”,现在这种讨论几乎绝迹。大神Andrej Karpathy,则是在感慨大模型规模正在“倒退”。

另一方面,近期市场上性能优秀的小型模型层出不穷,参数规模、任务处理、反应速度、安全性能,各公司在不同方面卷了又卷。

究竟是往大做探索极限,还是往小做迎合市场?

这最终汇总成一个问题:在这样模型快速更迭的市场中,要怎么才能把LLM模型的商业价值最大化?

1

唯快不破的模型业态

最近发起讨论的是X.ai创始成员之一的Toby Pohlen。他认为如果模型以指数级速度改进,那么训练模型的价值也会以指数级速度折旧。这也导致人们需要赶在模型更迭前就迅速采取行动获取商业价值,一旦模型产生更新,上一代模型就基本一文不值了。

Toby的这番言论深得老板Elon Musk之心,大笔一挥打了一个“100分”。

贾扬清也参与到了这场讨论中来,他用感恩节火鸡做了一个有趣的比喻。他提出,售卖模型就像是感恩节火鸡促销,必须在感恩节前夕抓紧时间售卖,避免在感恩节到来后的贬值。新模型的技术更新就是一个又一个感恩节,只有销售得更快才能赚到更多的利润。

(emmm…如果对火鸡不好了解,换成中秋节前抢月饼的故事大家或许应该容易理解一些?)

评论区也有不少人表达了对此观点的赞同。

有人说只要不断地开发新产品和迭代新模型,就能从中持续获得商业价值。

还有人说,模型改进的频率将直接决定模型本身的商业价值。

但是,模型的商业价值由什么决定,又该如何实现?

2

模型发展在走CNN老路吗?

模型必须做小,用起来才顺手。

比起大型模型,小型模型成本低应用便利,更能收获商业市场的青睐。贾扬清就发现,行业趋势在于研发和使用尺寸更小性能强大的模型,人们也更愿意把规模参数在7B-70B之间的中小型模型作为商业使用的选择。

作为前大模型时代的亲历者,贾扬清在当下LLM模型市场上嗅到了熟悉的味道,先变大再变小变高效,这和CNN时期的模型发展简直一模一样。

贾扬清还对CNN的发展历程做了一个简单的介绍。

首先是2012年,AlexNet开启了模型大小增长的序幕。2014年的VGGNet就是一个规模较大的高性能模型。

到了2015年,模型尺寸开始缩小。GoogleNet 将模型大小从GB降至MB,缩小了100倍,还同时保持了良好的性能。同年面世的SqueezeNet也遵循了追求更小尺寸的趋势。

在此之后,模型发展的重点转移到了维持平衡。比如如 ResNet(2015)、ResNeXT(2016)等模型都保持了一个适中的规模,注重计算效率。

贾扬清还介绍了CNN的一个有趣的应用,Google的MobileNet(2017),占用空间小性能优越,还具有出色的特征嵌入泛化。

最后,贾扬清引用了Ghimire 等人在《高效卷积神经网络和硬件加速调查》里的一张图:

他还进一步发问,LLM模型未来会遵循和CNN一样的发展趋势吗?

3

大型模型的盈利思考

不过贾扬清也补充道,虽然行业趋势是模型小型化,但并不意味着号召大家放弃尺寸更大的模型。

但这随之而来的是另一个问题:大型模型的成本会更高。

此前也有人提出质疑,对大型模型服务商的运营成本和营运收益做了简单的计算,每天8张H100显卡运营节点的成本约为1000美元,每天可以提供2600万token的服务,但按Llama 405B每一百万token 3美元的价格,怎么算都是亏本的,无法盈利的大型模型不会被市场抛弃吗?

贾扬清表示,哎你说这个我就不困了,我熟我来说:)

贾扬清认为,虽然每个请求大约每秒输出30个token,但通过批量处理(同时处理多个请求)可以显著提高总吞吐量,可以达到比单个请求高出10倍或更高的吞吐量。

同时他还指出,每秒大约30个token指的是输出token,大模型对于输入token的处理速度更快,这也增加了处理的总token数,大模型通常对输入和输出分别计费,也正是这个道理。

在后续的另一个回复,贾扬清做了更详细的量化计算:

批量输出速度:单并发405b推理通常有每秒30个token的输出速度。合理的并发可以使总吞吐量提高10倍,达到每秒300个token的输出吞吐量。

输入token:输入token也被计费,通常输入token的数量远大于输出token。一个常见的聊天机器人应用可能有2048个输入token和128个输出token。假设输入输出token比率为10:1,那么每秒300个输出token的处理量相当于每秒3000个输入token。

价格:每天总共处理285,120,000个token,按当前Lepton价格每百万token2.8美元计算,收入为798.34美元。

机器成本:以lambda按需价格为基准,每张H100卡每小时3.49美元,8张H100卡一天的成本为670.08美元。

收入798.34美元,成本670.08美元,因此通过整合多种技术方法,在合理流量下(像Lepton这样的大模型技术服务商)是可能盈利的。

当然,这只是一个简单的推算,实际的盈利还会受到流量稳定性、计费方式、按需使用GPU的机器成本控制、解码、提示缓存以及其他因素的影响。

但某种程度上说,类似深度学习时代对CNN的不断优化,在大模型时代,也需要技术人员对于模型进行种种优化,来保证性能提高的同时不断降低成本,这正是贾扬清看好的创业路线。

4

One more thing

我们不妨再多讨论一下,对于贾扬清这样的AI Infra创业者,模型大小的潮流变化对他的商业模式有什么影响?

这个问题,要分不同情况分析。

如果模型参数量越大,提供模型服务的门槛越高(参考Llama 405B),其客单价自然也就越大;

另一方面,由于很多小模型实际是在大模型的基础上蒸馏而得到,模型小了,所需的计算资源并没有等幅度减少

由于较小的模型更容易部署在不同的设备和平台上,这可能会带来应用场景的增加,虽然客单价可能降低,但在需求数量上的增加反而可能使得总收入增加;

对于贾扬清来说,META的开源路线使得贾扬清的服务对象扩大,因此开源对他来说更有利。

看来不管未来模型规模怎么不变化,贾扬清都有机会凭借技术升级稳坐钓鱼台。这有点像之前的中国股市,不管什么消息,都是“利好茅台”啊。

这恐怕就是贾扬清最近在推特上为什么这么活跃发表看法的原因?你看好贾扬清这种AI Infra的创业路线吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1981021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024华数杯C题解题思路及详细建模步骤分享+双语言代码

2024“华数杯”数模竞赛已经开赛啦,这次给大家带来的是今年华数杯C题解题思路,内容由我们团队的众多国奖学长学姐给大家出具高质量的解题思路,参考代码等,希望能助大家一臂之力。 问题1: 请问352 个城市中所有35200 个景点评分的最…

【Nuxt】约定式路由和 NuxtLink

约定式路由 手动创建&#xff1a; 或者还可以使用终端创建页面&#xff1a;nuxi-add-page npx nuxi add page about — about.vue npx nuxi add page about/index — about/index.vue <NuxtLink to"/"><button>Home</button></NuxtLink><…

25集 ESP32 C3 AI chat聊天工程代码流程-《MCU嵌入式AI开发笔记》

25集 ESP32 C3 AI chat聊天工程代码流程-《MCU嵌入式AI开发笔记》 我们打开Ai chat工程&#xff0c;用vscode。 main.c里面&#xff0c;重点看一下app_main函数。 Created with Raphal 2.3.0 开始 nvs_flash_init audio_hal_ctrl_codec audio init display init &#xff08…

AUTOSAR之AUTOSAR OS(下)

前言&#xff1a;在上篇中&#xff0c;我们主要描述了OSEK OS的相关内容以及AUTOSAR OS的OS Application对象的一些内容&#xff0c;包括Counter&#xff0c;Alarm&#xff0c;Enent&#xff0c;ISR&#xff0c;Task&#xff0c;Schudule Table等&#xff0c;本篇文章中&#x…

element-plus 菜单组件 index属性如何正确赋值?

element-plus 菜单组件 index属性如果直接填写字符串&#xff0c;就会报如下的错误 正确写法与错误写法 报错解释&#xff1a;Error parsing JavaScript expression: Unterminated regular expression. (1:2) 这个错误表明你在解析一个JavaScript表达式时遇到了一个未正确结束…

【人工智能专栏】 PCA Decomposition

PCA Decomposition 算法 去除平均值 。计算协方差矩阵 。计算协方差矩阵的特征值和特征向量 。将特征值排序 保留前N个最大的特征值对应的特征向量 。将原始特征转换到上面得到的N个特征向量构建的新空间中(最后两步,实现了特征压缩)。解释 为什么样本在“协方差矩阵C的最大…

元太电磁膜SUDE-10S19MI-01X驱动适配

屏规格书&#xff1a; dts配置&#xff1a; 首先要确保CONFIG_I2C_HID宏打开&#xff0c;i2c-hid-core.c 文件才能编译进去代码。规格书vendor product 分别为0x2d1f 和0x0165 来区别&#xff0c;不至于影响到整体的hid其他设备。 i2c-hid-dev10 { compatible "hid-…

WordPress主题 CeoMax-Pro_v7.6总裁主题资源下载类主题

CeoNova-Pro 主题是一款轻量级、且简洁大气、产品官网类主题&#xff0c;定位于高端产品官网、同时包含了知识付费、定制服务、问答社区、论坛交流、网址导航、以及付费产品购买下载等全方位覆盖。

数据库扩展新篇章:主流分库分表中间件全解析

摘要&#xff1a; 随着企业数据量的激增&#xff0c;传统的单体数据库架构已经无法满足日益增长的性能需求和数据管理复杂性。分库分表技术作为解决这一问题的有效手段&#xff0c;通过将数据水平或垂直地分散到多个数据库中&#xff0c;提高了系统的扩展性和处理能力。本文将详…

JAVA答题系统练习模拟考试平台支持H 5小程序APP公众号源码

&#x1f4dd;“答题系统练习模拟考试平台”——你的备考神器来啦&#xff01;&#x1f393; &#x1f4da;【精准题库&#xff0c;覆盖全面知识点】 备考路上&#xff0c;最怕的就是题目不够全、不够新&#xff01;“答题系统练习模拟考试平台”汇聚了海量精编题库&#xff…

【枚举】:复合态的处理( Flag = Flag1 | Flag2 )

一、引言 枚举 enum是我们用的比较多的类型&#xff0c;而枚举通常适用的场景&#xff0c;也是为了我们在业务逻辑处理时&#xff0c;作为不同的逻辑分支的判断条件&#xff1b;比起直接定义1~N这样魔幻到让人一头雾水的分支 Flag , 定义完美的枚举类型可以见名知意&#xff0…

六西格玛培训应该采用什么方式?

六西格玛&#xff0c;作为一套被全球顶尖企业广泛采用的管理哲学和方法论&#xff0c;无疑是帮助企业实现这一目标的强有力工具。那么&#xff0c;如何有效开展六西格玛培训&#xff0c;让这一理念深入人心&#xff0c;成为每位员工日常工作中的自觉行动呢&#xff1f;深圳天行…

双算法https证书获取指南

双算法HTTPS证书&#xff0c;同时支持国际主流算法&#xff08;如RSA、ECC&#xff09;和国密算法&#xff08;如SM2、SM3、SM4&#xff09;的SSL证书。这种证书能够在保证数据安全性的同时&#xff0c;满足不同用户群体和浏览器的需求。 以下是获取双算法HTTPS证书的详细指南…

坚果云,文件夹同步冲突、共享文件夹权限提示文件已共享实际查看不到

一、提示冲突 打开注册表 1、按下面的路径\HKEYLOCALMACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\SyncRootManager\看是否有 【Nutstore-临时】开头的项 和【Nutstore-通知】开头的项。如果有&#xff0c;删掉这两项就好了。 2、重新同步文件夹就可以了 二…

几种出现错误:找不到mfc140u.dll,无法继续执行代码是什么情况?

在使用电脑的时候&#xff0c;你的电脑是否突然出现关于&#xff1a;“找不到mfc140u.dll,无法继续执行代码”的提示&#xff0c;那么出现这样的提示有什么办法可以将找不到mfc140u.dll的问题进行解决呢&#xff1f;接下来就和大家聊聊如何将丢失的mfc140u.dll问题修复的方法。…

『Python学习笔记』Python环境管理器—Poetry入门指南

Python环境管理器—Poetry入门指南 文章目录 一. 基础知识1. Poetry是什么&#xff1f;2. 名词解释&#xff1a;虚拟环境管理、模块管理、模块依赖管理3. pip的不足 二. 从零开始使用Poetry1. 安装Poetry2. 初始化Poetry3. 管理Poetry 虚拟环境4. 修改config&#xff0c;建立专…

1区SCI,录用仅需2个月!国人发文量位居第二,超低版面费,毕业评职的救命神刊!

关注GZH【欧亚科睿学术】&#xff0c;第一时间了解期刊最新动态&#xff01; &#x1f525; &#x1f525; &#x1f525; &#x1f525; 中科院2区SCI&#xff0c;2个月即录用&#xff01; 《Journal of King Saud University-Computer and Information Sciences》是一…

给python初学者的一些建议

写在开篇 关于Python&#xff0c;可以这么说&#xff0c;这几年借着数据科学、机器学习与人工智能的东风&#xff0c;Python 老树开新花&#xff0c;在风口浪尖上居高不下。 Python 之所以这么受大家的青睐&#xff0c;是因为它语言简洁&#xff0c;上手容易&#xff0c;让非…

网络安全4

一. 查找网络漏洞的两种方式 1. CMS源码网站 很多网站在搭建的时候会使用网上的源码模板(可能是php&#xff0c;arp等等)&#xff0c;当我们找到cms之后就可以在网上搜索对应cms漏洞从而发现漏洞。或者下载对应cms源码到本地对源码白盒测试 如何判断网站cms 比如&#xff1a;…

股指期货交易中的MACD指标应用指南

在期货市场中&#xff0c;技术分析是投资者把握市场动向、做出交易决策的重要工具。技术指标众多&#xff0c;但没有绝对准确的指标&#xff0c;关键在于如何合理运用。本文将详细介绍MACD指标&#xff0c;帮助投资者更好地理解和运用这一工具。 一、什么是MACD指标&#xff1…