聊一聊大模型六小虎生存现状!

news2024/9/30 13:00:38

ChatGPT横空出世,打响了生成式AI创业热潮的发令枪。

在国内,智谱AI、百川智能、零一万物、月之暗面、Minimax率先领跑。今年6月,前微软全球副总裁姜大昕创办的阶跃星辰,开始受到资本的青睐,一轮20亿美元的融资,将其送上了第一梯队的牌桌。

自此,大模型创企的“六小虎”的格局形成。

从新年伊始,AI应用层的井喷被预告为今年AI领域的最强看点。

3月份,Kimi200万字长文本横空出世,率先出圈。此后大模型厂商开启了激烈的用户争夺战,用铺天盖地的投放轰炸目标用户的心智,越来越多的人开始了解AI工具,使用AI工具。

同时,今年的融资情况也异常顺利。纵观大模型“六小虎”,每位玩家都在今年取得了亿元以上的融资进展。

然而,我们也无法忽视大模型能力的增长正陷入普遍的停滞。

今天,距离OpenAI发布GPT-4已经足足过去了一年又六个月。新一代模型的发布就像“狼来了”的故事,AI社区普遍对奥特曼的谜语和炒作开始感到疲倦。

而作为AI创业的领头羊,OpenAI的商业化探索都依然迷茫。在ChatGPT增长呈现饱和后,OpenAI开始通过一系列开发工具的发布向B端发力,但收收支来看,仍然需要大笔的融资入账才能“续命”。

观之国内,大模型厂商们是否遇到了同样的困境?2024年已经过半,“六小虎”们过得还好吗?

模型能力增长放缓,

各家如何开卷产品差异化?

很多人期待GPT-5的发布能使模型能力再跃上一个台阶。

从目前的确切消息来看,OpenAI即将在秋季发布模型“草莓”,爆料称该模型特别擅长解决复杂的数学问题和编程问题,其生成的合成数据,正用于训练传说中的“下一代模型”猎户座。因此,“草莓”更像是针对特定领域的补丁,无法对其通用能力的提升抱有太多期待。

领跑者都在放慢脚步,模型能力的增长乏力有目共睹,追随者正渐渐跟上来,差距不断缩小。

放眼大模型“六小虎”,今年年中推出的新模型们纷纷“追平”了GPT-4。5月份,百川智能和零一万物前后脚发布的模型Yi-Large和Baichuan 4都在对标之余,实现了某几项能力的超越。同个月内,OpenAI展示了GPT-4o令人惊讶的“Her”功能,又掀起了大模型厂商对多模态能力的一轮追逐。7月,阶跃星辰发布了Step-1.5V多模态大模型,到了8月底,智谱发布的GLM-4-Plus已经持平GPT-4o,甚至抢先开始进行Her视频通话功能的内测上线。

模型能力卷不动的大前提下,怎么用AI能力、给谁用AI能力变成了极为重要的商业抉择。杨植麟和他的月之暗面坚定的选择了To C这条路,3月份Kimi打出的“长文本”功能带来了极大的关注,此后月活量在一众国产chatbot中居高不下,此后又率先推出了浏览器插件进一步争夺流量入口。

相较月之暗面的all in Kimi,MiniMax和阶跃星辰在C端产品的布局更相似,两者都推出了主打生产力工具的产品(海螺AI、跃问),又推出了一款AI陪伴产品(星野、冒泡鸭)。

以最近月活表现大好(据AI产品榜统计,8月的月活跃率长达7天)的星野为例,如果以AI陪伴功能来评判星野,其独特的玩法和用户共创的各种角色使得其成为一款完成度很高的产品。MiniMax的创始人闫俊杰,却不认为星野是中国版的Character.AI,他说“(星野的)底层设计不是陪伴用户聊天,而是一个内容社区。”从这里判断,闫俊杰的野心是希望该产品最终形成小红书、B站等APP的社区形态,虽然目前距离这一目标尚且遥远。

同样注重To C的还有零一万物,创始人李开复不看好AI产品在B端的市场推广,提出“零一万物要坚决地做to C,坚决不做赔钱的to B”。与前面三个“小虎”不同,零一万物选择了出海,推出了生产力工具PopAi。如果按照李开复的C端路线图来走,零一下一个阶段应该会尝试推出AI-first的娱乐、音乐、游戏等方向的应用。

综合来看,C端能成为AI时代Super App的形态还没有被挖掘出来。差异化仍然没有逃脱出“雕花”的范围,给人一种“草色遥看近却无”的迷离之感。

相对的,智谱AI和百川智能把更多的精力投入到To B赛道。智谱看好B端用户的付费意愿,也认为公司的基因适合做To B, CEO张鹏曾坦言:“我们推C端产品的目的是为了向B端用户展示能力”。值得一提的是,这家清华系出身的企业,现在客户总数已超过1000家,多次中标大型企事业单位的合作,这可能成为智谱最坚实的壁垒。

同样选择To B,王小川对医疗行业的浓厚兴趣,使得百川智能似乎是唯一一个有专攻领域的“小虎”。王小川曾说,““医疗是大模型皇冠上的明珠”。从此出发,百川智能也与许多医疗机构达成了合作,最新的进展是8月底宣布将与北京儿童医院推出儿童健康大模型。

当然,大模型“六小虎”虽然在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。例如百川智能姗姗来迟的chatbot“百小应”。

大模型厂商想卷出产品上的差异化,却卷得不够明白。

加之AI应用在大众层面的渗透率还不够高,谁能抢先触达到用户就变成了模型间竞争的一个关键。大模型厂商在线上线下纷纷铺开营销,其争夺用户和流量的强度有着愈演愈烈的趋势——烧钱,烧更多的钱。

烧钱的游戏还在持续,

但资本只垂青强者

当杨植麟在采访中被问到“如果你今天拿到的钱是最后一笔钱,你会怎么花这笔钱?”,他坦诚地回答:“ 我希望这个永远不会发生,因为我们未来还需要很多钱。 ”

杨植麟所言非虚,今年上半年,AI“六小虎”开启了激烈的用户争夺大战,一度达到了“百家投流”的局面。以月之暗面为例,3月起Kimi在B站开启了持续的轰炸式投放,涌入的新增用户让月之暗面尝到了甜头。

根据媒体报道,月之暗面对于Kimi PC端的新增用户报价在38-40元范围内,从此推算,Kimi通过B站投流获得一位新增用户,起码要支付30元——这是一个让其他创业公司都望而却步的价格。

B站用户相对年轻、乐于尝试的特点,让其成为大模型广告投放的绝佳场域。此外,也不乏有大模型厂商尝试线下渠道,例如智谱清言就在地铁铺放了“更懂打工人的AI助手”海报,通过结合一系列办公痛点,力图精准击中挤在早晚高峰的职场白领。

此番投流的效果显著,根据报道,AI五小龙(未统计入阶跃星辰)产品的总访问量,在6个月内暴涨了963%。然而,这波高调的投放并未瞄准直接的商业化回报,只是为抢在对手之前获得更多的早期用户。

不过,相比更为烧钱的研发支出来说,这些营销费用可能只是毛毛雨。从OpenAI的数据来看,外媒爆料这家AI模型领头羊每年支出85亿美元,包括40亿的算力成本、30亿的训练和数据成本以及15亿元的人力成本。手握全球最成功的C端AI应用ChatGPT,OpenAI在年收入到达35亿的情况下,还得亏损50亿美元左右。

可想而知,国内的情况也并不乐观,李开复曾透露,“零一万物今年 ToC 单一产品收入达 1 亿元人民币,ROI 在 1 左右。所以这样的结果至少从国内大模型公司来看是非常有优势的。”考虑到海内外用户付费意识的差距,“六小虎”距离收支平衡还有很远、很难的路要走。

因此,对于包括OpenAI在内的大模型厂商来说,没有真正的安全——一旦融资不顺利,失去的可能就是最后的“救命钱”。

不过,今年“六小虎”的融资情况还算乐观,场上的所有玩家都拿到了亿元以上的融资。从近两个月来看,资本对AI创企的热情依然高涨。7月底,百川智能完成A轮融资,总融资金额达50亿元,并将在接下来以200亿元(人民币)估值开启 B 轮融资。8月初,零一万物又拿到了数亿美元的新一轮融资。更不用说月之暗面,在阿里占股四成的情况下,还罕见地拿到了腾讯的参投,这轮融资后其估值也来到了33亿美元的新高点。

此外,如果全球投资数据也展现了对人工智能的偏好,根据智库CB Insights的报告,虽然全球风投交易整体处于低迷状态,但人工智能却逆势上涨,仅2024第二季度,AI初创就获得了183亿美元的融资总额,占全球VC融资总额的28%。

值得注意的是, 在这183亿元中,马斯克的 xAI 公司就占到 60 亿美元,约为总金额的三分之一。考虑到xAI在特斯拉公司获得的数据和人才,以及在X平台上获取实时数据的独特优势,很难将其当做一家纯粹的初创公司看待。

报告给出的结论是,投资者对那些已有成熟技术生态系统的企业情有独钟,资本会对更少的公司进行更大规模的投资,而不是扶持那些排行榜位次靠后的小企业。

朱啸虎的观点则更加激进,在近期接受界面新闻采访时直说,独立大模型公司活不下来:“我上次发朋友圈说(5年内就没有独立的大模型公司)的时候,就有很多国内知名投资人在下面说5年都太长了,可能3年就没有独立的大模型公司了。确实是这样的,接下来融资都很难。 ”

融资难,却并不代表不能成。OpenAI新一轮数亿美元的“续命”融资即将到位,对标其1000 亿美元的身价,国内大模型“六小虎”的估值上升空间还很大。

提到对标OpenAI,有一件有趣的事情:国内大模型厂商也开始布局对AI创企的投资了。今年1月份,智谱AI曾公布将联合生态伙伴正式推出AGI生态基金“Z 基金”,基金总额达到10亿元人民币,截至目前,其投资的公司已达10余家。同时,月之暗面也似乎有投资动作,该公司创始成员汪箴拥有投资机构的从业经历,知情人士透露曾就其产品接洽过月之暗面的投资部门。

大模型厂商的“不务正业”,是一种“既要又要”的野心,也是迫于AI生态链不完善的一种无奈。

从人事变动看增长停滞:

裁员、出走与内斗大戏

最近,小红书上的AI博主@橘子汽水铺爆料称,“大模型六小虎的情况,略显悲观”。这篇帖子及后续内容透露了大模型头部厂商“裁员”“锁HC”“团队出走”“内斗”等一系列人事变动的爆料。

虽然这些逸闻的真实性有待考证,但我们能捕捉到这场动荡的蛛丝马迹。

8月底,零一万物的算法副总裁黄文灏被证实已加盟字节的大模型团队,负责技术项目管理和规划。紧接着,另一位公司的核心成员李先刚也被爆出走,选择返回“老东家”贝壳任职,他曾任过零一万物的法定代表人。

核心成员的频繁变动,揭开了AI企业内部动荡的冰山一角。但从招聘平台上看,智谱AI、百川智能、Minimax、阶跃星辰都还有大量的岗位放出,其中不乏薪酬待遇优厚的技术岗位。

看起来,大模型厂商并未放弃团队扩张的计划。

AGI的等待:冲刺上市,旷日持久


大模型“六小虎”的路绝不是一帆风顺。

时间拨回到23年,美团联合创始人王慧文在创建光年之外时,提出过“双轮驱动”的设想。虽然光年之外由于种种原因退出了大模型的竞技场,但不少AI创企延续了这个思路的探索。

但是,在整理此篇文章的时候,越来越直观地感受到:模型能力增长与商业化探索,这两条路皆阻碍重重。站在这个角度,也许更能理解王慧文当时所感受到的压力和焦灼,最终光年之外以被美团收购草草离场。

依照朱啸虎的看法,这或许是一家独立大模型的最好结局。

从硅谷的先例来看,微软花费40亿,“吞掉”了初创企业Inflection AI,带走了其联合创始人Mustafa Suleyman和Karén Simonyan,以及“大多数员工”。时隔不久,谷歌又如法炮制,支付数十亿美元,吸纳了独角兽Character.AI联合创始人Noam Shazeer和Daniel De Freitas,以及约30名研发人员。

于是朱啸虎提出了一个扎心的问题:“好的结果就是卖给大厂。但是在国内来说,你到底有没有一些额外的人才是大厂没有的?这是每个投资人都要思考的问题,大厂会不会为了这些人才花这么多钱去并购? ”

不过,答案没有那么绝对。

根据外媒The Information推测,IPO或将成为OpenAI的出路。上市可以为OpenAI提供大量的、源源不断的资金支持,提高品牌知名度。此前,OpenAI在聘请Sarah Friar担任首席财务官时,外界就对其上市动向有所猜测,这位信任CFO曾帮助支付公司 Square、社交网络Nextdoor完成上市安排。

此前的爆料透露,“六小虎”已经有公司在冲刺上市了。而零一万物的李开复也早有这个想法,他曾分享说,一年前,他就跟投资人自愿主动承诺:10年内自己不会套现。他说:“我认为套现最好的方式是赶快上市,这是我们未来努力的方向。”

这场努力可能旷日持久。AGI带着改变世界的宏大愿景,其实现必然不可能一蹴而就。对于AI技术来说,负面的声音可能会在漫长的瓶颈期中一直持续。

但是,抱有一丝乐观又何妨?2013年,斯派克·琼斯执导的电影《Her》上映了,谁能设想仅仅十余年之后,我们就将遇见自己的萨曼莎呢?

在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2179683.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

服务器使用frp做内网穿透详细教程,请码住

目录 1.内网穿透的定义 2.前提条件 3.frp下载地址 4.配置服务器端的frps.toml文件 5. 配置客户端,即物理服务器或者是电脑本机地址 6.添加服务端启动命令startServerFrp.sh 7.添加客户端启动命令startClientFrp.sh 8. 查看服务端启动日志 9.查看客户端启…

HTML+CSS - 表单交互(一)

1. 前言 ​​​​​​​ Web 表单是用于和用户交互的强大工具——其常用于收集用户数据和控制用户界面。 web 表单是用户和 web 站点或应用程序之间交互的主要内容之一。它们允许用户输入数据,大多数情况下会将数据发送到 web 服务器进行处理和存储 2. form标签 …

数据飞轮赋能科学决策:火山引擎 DataTester 升级 A/B 大模型评测

在数字化浪潮的推动下,企业数据化转型已成为不可逆转的时代趋势。随着企业对数据价值认知的深化,从优化数据管理到内部数据普惠,再到数据资产价值的充分挖掘,数据产品需求呈现爆发式增长。作为推动企业数智化升级的新范式&#xf…

数造科技入选中国信通院《高质量数字化转型产品及服务全景图》三大板块

9月24日,2024大模型数字生态发展大会暨“铸基计划”年中会议在北京召开。会上,中国信通院发布了2024年《高质量数字化转型产品及服务全景图(上半年度)》和《高质量数字化转型技术解决方案(上半年度)》等多项…

解决银河麒麟操作系统“/dev/root does not exist”错误的快速方法

解决银河麒麟操作系统“/dev/root does not exist”错误的快速方法 1、步骤2、注意 💖The Begin💖点点关注,收藏不迷路💖 在安装系统时遇到“/dev/root does not exist”错误,通常是因为引导程序未正确设置启动设备。以…

golang学习笔记27-反射【重要】

本节也是GO核心部分,很重要。包括基本类型的反射,结构体类型的反射,类别方法Kind(),修改变量的值。 目录 一、概念,基本类型的反射二、结构体类型的反射三、类别方法Kind()四、修改变量的值 一、概念,基本…

Linux云计算 |【第四阶段】RDBMS1-DAY3

主要内容: 子查询(单行单列、多行单列、单行多列、多行多列)、分页查询limit、联合查询union、插入语句、修改语句、删除语句 一、子查询 子查询就是指的在一个完整的查询语句之中,嵌套若干个不同功能的小查询,从而一…

STM32 OLED

文章目录 前言一、OLED是什么?二、使用步骤1.复制 OLED.C .H文件1.1 遇到问题 2.统一风格3.主函数引用头文件3.1 oled.h 提供了什么函数 4.介绍显示一个字符的函数5. 显示十进制函数的讲解 三、使用注意事项3.1 配置符合自己的引脚3.2 花屏总结 前言 提示&#xff…

第L2周:机器学习|线性回归模型 LinearRegression:2. 多元线性回归模型

本文为365天深度学习训练营 中的学习记录博客原作者:K同学啊 任务: ●1. 学习本文的多元线形回归模型。 ●2. 参考文本预测花瓣宽度的方法,选用其他三个变量来预测花瓣长度。 一、多元线性回归 简单线性回归:影响 Y 的因素唯一&…

python15_转换为ASCII

转换为ASCII A A B 你好 C 66def str_to_ascii(s):# 如果输入是单个字符,直接返回其ASCII值if len(s) 1:return ord(s)# 否则返回每个字符的ASCII值列表return [ord(char) for char in s]def int_to_ascii(i):# 将整数转换为对应的ASCII字符return chr(i)if __…

气膜仓库出售:智能高效的新选择—轻空间

随着现代物流和仓储需求的不断增长,传统仓库模式已经难以满足市场的多样化需求。气膜仓库凭借其灵活性、高效性和智能化的特点,成为仓储领域的新宠,而现在,我们推出了全新方向——气膜仓库出售,为企业提供更加灵活的资…

hex 文件和 bin 文件剖析

目录 一、概述二、hex 文件三、bin 文件 在单片机开发中,hex 文件和 bin 文件是非常常见的两种烧写文件格式。比如在 Keil 中,编译好程序后,点击 Download 就可以把 hex 文件烧录到板子上。 而有时候在我们实现 IAP 时,有需要生成…

《动手学深度学习》笔记2.5——神经网络从基础→使用GPU (CUDA-单卡-多卡-张量操作)

目录 0. 前言 原书正文 1. 计算设备 (CPU和GPU) 补充:torch版本cuda报错的解决方案 2. 张量与GPU 3. 存储在GPU上 4. 复制(多卡操作) 5. 旁注 (CPU和GPU之间挪数据) 6. 神经网络与GPU 小结 0. 前言 课程全部代码(pytorc…

Linux进程终止进程等待进程程序替换

目录 一、进程终止 1.1进程退出的场景 1.2进程常见的退出方法 ​1.3多进程的退出 ​1.4exit( )和_exit( ) 二、进程等待 2.1进程等待的必要性 2.2进程等待的方式 2.3获取子进程的statue 2.4非阻塞轮询 2.5进程等待的底层原理 三、进程程序替换 3.1单进程程序替换 …

踩坑Resilience4j @Bulkhead

先说问题情况 系统环境 java version: 17spring boot: 3.xspring cloud: 4.x 项目配置和代码 项目中使用了Spring Cloud Circuit Breaker <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-circuitbre…

Android 简单实现联系人列表+字母索引联动效果

效果如上图。 Main Ideas 左右两个列表左列表展示人员数据&#xff0c;含有姓氏首字母的 header item右列表是一个全由姓氏首字母组成的索引列表&#xff0c;点击某个item&#xff0c;展示一个气泡组件(它会自动延时关闭)&#xff0c; 左列表滚动并显示与点击的索引列表item …

Solidity智能合约调用其他合约的三种主要方式

在 Solidity 中&#xff0c;智能合约之间的交互非常重要。调用其他合约的功能可以增强合约的灵活性&#xff0c;使其能够执行跨合约操作&#xff0c;比如获取数据、转移资金或触发其他合约的功能。本文将详细介绍 Solidity 中调用其他合约的不同方式及其应用场景。 1. 合约间调…

【Unity踩坑】Unity更新Google Play结算库

一、问题描述&#xff1a; 在Google Play上提交了app bundle后&#xff0c;提示如下错误。 我使用的是Unity 2022.01.20f1&#xff0c;看来用的Play结算库版本是4.0 查了一下文档&#xff0c;Google Play结算库的维护周期是两年。现在需要更新到至少6.0。 二、更新过程 1. 下…

JAVA内存模型!=JVM内存模型

文章目录 前言JVM内存模型JAVA内存模型JAVA内存模型解释的问题可见性问题一致性问题 总结 前言 有很多JAVA开发人员&#xff0c;在被问起&#xff1a;“你知道Java内存模型吗&#xff1f;”&#xff0c;都会回答&#xff1a;“知道&#xff0c;JAVA内存模型分为方法区、堆、……

悟透自己、悟透生活、悟透人生(此文无价)

很多人都会有这样的疑问&#xff1a;“为什么听了很多道理&#xff0c;却依然没有过好这一生&#xff1f;” 古人给出了这样的回答。 王阳明曾说&#xff1a;“知行合一。” 老子则言&#xff1a;“知人者智&#xff0c;自知者明。” 可见&#xff0c;一切问题的根源都出在了我…