大模型开闭源之争,本质是商业化的争夺

news2025/2/28 12:11:53

大模型从发展之初,即存在开源与闭源两条路线,孰优孰劣,也处于持续争论之中。2024年7月,在“2024世界人工智能大会”上,众多业内领军人物对大模型开闭源表达了针锋相对的观点。例如,百度创始人李彦宏站在闭源“阵营”,而百川的王小川、360的周鸿祎、猎豹的傅盛则持相反观点,双方均认为对方的路线是一种“智商税”。

历史规律

路线差异,结果一致

01

对于大模型开源闭源的孰优孰劣,以及未来发展前景如何,可以从软件产业开源与闭源的发展历史中,寻找到相应的发展规律。

首先,开源与闭源是对软件产品开发模式和商业模式不同的路径探索。具体对比如表1所示。

其次,开源与闭源的结果殊途同归。闭源一直有之;而开源,则起步于20世纪70年代的“自由软件运动”,后于1985年成立自由软件基金会,至20世纪90年代,完全的“自由”逐步被规范化、商业化的“开源”所取代,并在1998年成立了开放源代码促进会。从长期效果来看,两者并存并且各自推出了可相互媲美的产品,例如操作系统领域的Windows和Linux,数据库领域的Oracle与MySQL等。对于复杂的大型软件产品而言,即便前期是由软件爱好者共同开发出原始版本(如Linux),但最终也是由大企业负责后期商业版本的推进。

最后,开源与闭源的过程,体现了适用性的差异。一是产品类型的适用性问题。总体而言,开源适合通用型的工具产品,闭源则更适用于ERP等涉及深层次行业经验的产品(相关经验一般积累在企业的知识库中)。二是产品规模的适用性问题。总体而言,开源适合小规模的软件产品,闭源则更适合体量较大的软件产品,一些操作系统、数据库等在后期商业化进程中,亦偏向闭源经营模式。三是经营企业适用性。行业中绝对领先的企业基本采用闭源模式,以保证市场控制;而行业挑战者则偏好开源,可以快速打造产品和生态。

大模型现状

大企业主导开闭源之争

商业路线是核心

02

2022年11月,GPT-3.5的发布推动了大模型产业进入爆发性增长期,“百模大战”快速向“千模大战”迈进。在此过程中,开源与闭源路线一直是争议的焦点。

值得注意的是,大模型的开源与早期软件产业的开源有着显著不同。软件开源遵循“爱好者发布原型——群体性打磨——大企业打造发布版——代码开源而商业闭源——爱好者成为生态助力”;而大模型开源,则直接跳过了前两个阶段,直接由大企业发布代码开源产品,这导致了两个结果。

第一,产品质量取决于企业能力,与开闭源无关。若以闭源的ChatGPT为标杆,则闭源的产品质量一直保持领先。2023年下半年,以Meta的Llama3为代表的多个开源模型发布,在评测中有不少已超过GPT-3.5的能力,甚至接近GPT-4的能力;但2024年闭源Sora发布后,上述差距又被进一步拉大。

业内人士认为,产品质量的差距与是否开源基本无关,而取决于研发团队的能力,即团队可以调配的资金、算力和数据。在大企业对大模型代码开源后,开源社区对产品质量提升的幅度不足5%,基本可以忽略不计。一方面,大企业发布的产品完备性较高;另一方面,训练大模型成本高昂,已经不是开源社区内中小主体能够承担得起的,尤其是大规模参数模型训练。

第二,开闭源之争,实际是商业化的争夺。从历史经验可知,开源或者闭源,是不同企业对最适合自身的商业化路径选择。选择将大模型闭源的有OpenAI的ChatGPT、百度的文心一言、华为的盘古、商汤的日日新等,其共同特征是企业在各自的领域中均处于领先地位,闭源后拥有更好的自我保护能力,并可形成许可证销售等商业形态。而选择开源的Meta、谷歌、百川、360、阿里等企业,均是行业的追赶者,它们希望借助“Linux模式”,聚合生态力量,在商业上实现对领先者的赶超。至于处在“长尾”中的大模型厂商,它们的产品大多基于开源大模型而开发,因此亦为开源的拥护者。

大模型未来

“两条腿走路”

加速商业落地

03

大模型产业发展至今,进一步提升大模型质量固然重要,但更重要的是尽快实现商业落地。为此,2024年5月百度、火山等国内大模型厂商开启了“价格战”;同时,大模型厂商也形成共识,即实现大模型在行业场景中落地。

商业化成为大模型行业的重心,各个企业开源或闭源的路线选择亦是立足于企业的资源禀赋,服务于商业化路线,尤其是推动行业应用落地。着眼于未来发展,大模型行业将采用开源与闭源并存的“两条腿走路”发展策略,具体包括三种模式。

一是侧重闭源模式,但会叠加开源生态。上文提及在产业中具有显著领先优势的企业,如OpenAI、百度、华为等,仍然对各自的核心大模型产品采用闭源发展的模式,以实现绝对掌控权。但为了促进应用场景的落地,它们将叠加开源生态,其中包括插件市场的生态,如PPT制作、行业数据库接入等;以及衍生训练的大模型生态,如基于盘古大模型的行业大模型、场景大模型等。

二是侧重开源模式,但要打造基座产品。上文所提及的行业跟随者,如Meta、阿里、百川、360、猎豹等,是开源模式的拥护者。它们需要借助开源社区,提升基础大模型产品质量,使开发者直接使用谷歌、Meta等厂商的大模型进行训练,以及优化算法;同时需要实现产业生态的构建,在此过程中,将优先打造可供使用的“基座型”产品。

三是闭源与开源并存模式,选择适合的模型进行开源。其共同的特征是在较大模型上选择闭源,在较小模型上选择开源。如谷歌的“Gemma(开)+Gemini(闭)”组合、科大讯飞的“星火开源(开)+讯飞星火(闭)”组合、商汤科技的“书生(开)+日日新(闭)”组合等。开闭源的产品组合在强化对核心产品控制力的同时,也促进了生态发展。实际上,大参数模型由于训练成本较高,开源生态贡献较为有限。

从大模型整体发展来看,业界当前所聚焦的大模型算法开源或闭源,仅仅是一个方面,而训练数据的开源或闭源,也同样需要关注。笔者认为,未来的数据集仍将是以开源与闭源的方式并存,预计其中开源数据集将占据市场80%的数据量,主要解决大模型“可训练”的问题,并基于此形成通用大模型底座;而闭源数据集将占据市场20%的数据量,主要解决大模型“训练好”的问题,并基于此形成差异化大模型产品,尤其是面向行业或场景的大模型,这才是大模型厂商竞争的焦点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1959594.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

成功解决:java.security.InvalidKeyException: Illegal key size

在集成微信支付到Spring Boot项目时,可能会遇到启动报错 java.security.InvalidKeyException: Illegal key size 的问题。这是由于Java加密扩展(JCE)限制了密钥的长度。幸运的是,我们可以通过简单的替换文件来解决这个问题。 解决…

LeetCode 17.电话号码的字母组合 C++写法

LeetCode 17.电话号码的字母组合 C写法 思路🧐: 使用深度优先搜索递归进行解题。首先建立一个号码与字母的映射表,当接收传过来的号码字符串时减去字符0就可以拿到该号码。其次使用string存储当前号码所对应字母,然后for循环遍历字…

用Java手写jvm之尝试解析clazz文件内容

写在前面 源码 。 本文尝试来解析下class文件的内容,了解了class文件内容后,对我们提升java认知将会带来很大的帮助,有多大呢,不好说,总之很大很大,大到受不了😍😍😍。 …

安泰高压放大器在工业领域中的应用

高压放大器是一种在工业领域中发挥重要作用的电子设备,其功能是将低电压信号放大到更高的电压水平。这种设备在多个工业应用中都发挥着关键作用,提供了稳定、可调节的高电压输出。以下是高压放大器在工业领域中的主要应用: 1.精密仪器和实验室…

尚硅谷电商实时数仓笔记-《二》数仓建模概述

上一篇: 尚硅谷电商实时数仓笔记-《一》数仓概述-CSDN博客 二、数仓建模概述 2.1 数据仓库建模的意义 如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置; 如果把数据看作城市的建筑,我们希望城市规划布局合理…

面试官没想到一个ArrayList,我都能跟他扯半小时

点赞再看,Java进阶一大半 南哥在stackoverflow社区看到14年前的这么一个问题:Java 的 Vector.add() 和 Vector.addElement() 有什么区别,大家有答案吗? 它们实际上没有区别!!!1996年的JDK 1.0版…

每日一题,力扣leetcode Hot100之56. 合并区间

解题思路: 先按照每个数组的第一个数字sort排序。 每次进来一个数组,如果你的第1项大于别人的第2项,那么直接添加。 否则的话则存在可以合并的区间,然后合并的区间的第2项则为旧的和新的第2项的最大值。 class Solution:def m…

SpringBoot框架简单整合ShardingSphere-JDBC实现MySQL分库分表和读写分离及加密混合

1. 主从配置 1.1 主机1(IP:192.168.186.77) 1.1.1 docker-compose.yml version: 3.8services:mysql-master:image: mysql:latestcontainer_name: mysql-masterenvironment:MYSQL_ROOT_PASSWORD: 123456MYSQL_USER: masterMYSQL_PASSWORD: 123456MYSQL…

计算机毕业设计Hadoop+Spark旅游景点可视化 旅游景点推荐系统 景区游客满意度预测与优化 Apriori算法 景区客流量预测 旅游大数据 景点规划

### 开题报告 **论文题目:** 基于Spark的旅游景点可视化系统的设计与实现 **研究背景与意义:** 随着旅游业的快速发展,人们对旅游信息的获取和处理需求越来越高。传统的旅游信息系统虽然能够提供静态的数据查询和展示功能,但在…

短视频矩阵管理系统开发

在短视频内容爆炸式增长的今天,如何高效管理多个账号,同时保持内容的创新性和互动性,成为了创作者和品牌面临的重大挑战。短视频矩阵管理系统的开发,正是为了解决这一问题,提供一个全面的解决方案。 多账号管理&#…

本地调试指引文档

在开发组件库时,我们经常需要在真实的项目中测试组件库的功能,所以需要进行本地调试,本文介绍两种组件库本地调试流程, 1.使用beta版本 2.使用npm link 两种都可以作为本地调试的方案,本文作为一个参考资料&#xff0…

【机器学习】机器学习的分类算法以及使用逻辑回归算法进行分类

引言 机器学习中的分类算法是一种监督学习算法,其目的是根据已知的输入和输出(即特征和标签)来训练模型,以便能够预测未标记数据的类别标签 文章目录 引言一、分类算法1.1 逻辑回归(Logistic Regression)1.…

新手小白,开放式耳机该如何挑选?自费无广开放式耳机评测

作为一个在耳机领域探索多年的人,看到这个问题,我觉得有必要分享一些实用的经验和见解,希望能帮助到各位新手朋友。 首先要来说的就是在挑选开放式耳机的时候需要注意的几个点: 一、佩戴的稳固性。开放式耳机的设计较为独特,如果…

详细指南丨Apache环境下如何配置HTTPS证书

在Apache环境下部署SSL证书通常涉及几个步骤,包括生成私钥、创建CSR(证书签名请求)、安装SSL证书以及配置Apache服务器。下面是详细的步骤说明: 1. 准备工作 确认服务器和域名:需要有一台已经设置好的Apache服务器和…

后台管理系统(springboot+vue3+mysql)

系列文章目录 1.SpringBoot整合RabbitMQ并实现消息发送与接收 2. 解析JSON格式参数 & 修改对象的key 3. VUE整合Echarts实现简单的数据可视化 4. List<HashMap<String,String>>实现自定义字符串排序(key排序、Val…

规划决策算法(四)---Frenet坐标系

知乎:坐标系转换 1.Frenet 坐标系 什么是 Frenet 坐标系: 为什么使用 Frenet 坐标系: 通常情况,我们只会关注车辆当前距离左右车道线的距离,来判断是否偏离车道,是否需要打方向盘进行方向微调。而不是基于…

学习测试15-实战6-根据说明书建工程

CAN协议说明书:含义 一,得到表 1,先建信号 2,建报文,将对应信号拖入其中 3,建节点,将报文添加进TX msg里 调整起始位 数据库建立完成 二,不需要面板,直接导入数据库&…

OpenCV图像滤波(4)构建图像金字塔函数buildPyramid()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在计算机视觉和图像处理中,构建图像金字塔(Image Pyramid)是一种常用的技术,它生成一系列分辨率逐…

怎么保护电脑文件夹?文件夹保护方法大盘点

文件夹是管理电脑数据的重要工具,可以有效避免数据混乱。而为了避免文件夹数据泄露,我们需要严格保护文件夹。下面我们就来盘点一下文件夹的保护方法。 文件夹隐藏 隐藏文件夹是一种简单有效的保护方式,通过隐藏文件夹来避免其他人发现&…

【算法】道格拉斯

一、引言 道格拉斯算法是一种用于曲线拟合的数学方法,特别是在处理曲线插值问题时非常有用。道格拉斯-普克算法(Douglas-Peucker Algorithm),简称D-P算法,是一种用于简化多边形或折线的高效算法,由David Do…