科技云报道:开源才是大模型的未来?

news2025/2/10 22:22:04

科技云报道原创。

一年前,ChatGPT横空出世;7个多月后,Meta宣布开源LLaMA 2,并且可免费商用。

这一天,也成为大模型发展的分水岭。短时间内,LLaMA 2对一些闭源的大模型厂商造成了致命性的打击。

随后,全球头部厂商和创业公司纷纷加入开源浪潮中。目前,国内也有近一半的大模型选择了开源的方式:

今年7月,智谱AI宣布开源大模型ChatGLM-6B和ChatGLM2-6B,这两个模型的下载量已经先后超过300万和120万。

8月,阿里宣布开源通义千问70亿参数模型Qwen-7B,一个多月下载量破100万;12月,阿里持续开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。

9月,百川智能宣布开源Baichuan-7B、13B两款大模型,其下载量目前已经突破500万,200多家企业申请部署开源大模型。

11月,元象XVERSE宣布开源650亿参数高性能通用大模型XVERSE-65B;

11月底,浪潮信息发布完全开源且可免费商用的源2.0基础大模型,包含1026亿、518亿、21亿不同参数规模…

仅仅在过去的一个月内,国内最大开源模型的参数纪录就已经被刷新了N次。性能参数、性价比、可靠性,正成为抢占先机的关键词,而开源似乎也成为大模型发展的主流趋势。
在这里插入图片描述

有业内人士认为,未来90%的企业会倾向基于开源大模型发展。那么,开源是否真的是大模型的未来?

开源大模型快速赶超

开源大模型的核心理念是开放源代码,允许公众访问、使用、修改和分发模型的源代码。

面对市场竞争,开源大模型的免费使用是非常有吸引力的获客手段;同时,低成本的试错也有助于开源大模型更快触达潜在用户群体,降低企业认知和决策难度,加速创新。

从技术角度看,大模型涉及许多技术问题,单靠一家企业很难解决。开源大模型鼓励全球开发者社区的参与和贡献,这种集体智慧能够加速技术的迭代和创新,如GitHub上的众多AI项目就证明了这一点。

不仅如此,开源代码使得研究人员和用户能够审查模型的工作原理和决策过程,从而提高大模型的透明度和可信赖性。这对于解决AI的公平性、偏见和伦理问题至关重要。

事实上,自从LLaMA 2开源后,业界开始意识到大模型技术没有任何护栏。

基于成本的考虑,许多企业选择放弃支付上千万元的调用闭源大模型API的费用,转而部署和微调LLaMA 2。

创业者们的目光从解构、增强LLaMA 2转向了构建行业专有大模型,又掀起了一波LLaMA 2+司法、LLaMA 2+医疗等一系列的行业开源大模型。据不完全统计,LLaMA 2开源后,国内就涌现出了十几个开源行业大模型。

一份从谷歌内部泄露出来的备忘录(标题是《我们没有护城河》)证实了这种观点:

“我们无法赢得这场军备竞赛,OpenAI 也一样。当我们争吵不休的时候,第三个派系(开源)却在悄悄地吃掉我们的午餐”。

谷歌备忘录作者发现,自从LLaMA开源后,立刻出现了大量的创新,重大开发成果之间的间隔也在缩短。

Meta是一个明显的赢家,他们有效地获得了整个星球的免费劳动力,大多数开源创新都发生在他们的架构之上,没有什么能阻止他们将其直接整合到他们的产品中。

“当免费、不受限制的替代品在质量上具有可比性时,人们就不会为受限制的模型付费”,备忘录里写道。

最近,Meta首席AI科学家Yann LeCun转发了方舟投资(ARK Invest)制作的一张趋势图,描绘了开源社区与闭源模型在生成式AI上的发展。

“开源人工智能模型正走在超越专有模型的路上”,他感概道。

有网友甚至表示,我们正在接近一个临界点。以目前开源社区项目的发展速度,开源大模型将在未来12个月内达到GPT-4的水平。

未来1-2年,开源力量可能在与闭源大模型分庭抗礼。

开源大模型的商业化挑战

尽管开源已成为现阶段大模型发展的一种主流趋势,开源大模型的发展速度也远快于封闭生态系统,但并非所有的厂商都选择开源路线,也并不代表厂商会一直开源所有的大模型。

比如,以开源切入大模型赛道的百川智能,在发布完Baichuan-7B、Baichuan-13B开源大模型后,参数更大的Baichuan-53B大模型则选择了闭源。

由此可见,开源或闭源并非大模型的唯一发展路径。在当下,能够闭源的大模型一定是可以提供足够高的价值,帮用户更好地完成高性能的大模型训练、推理和部署,通过调用API的方式来帮助用户降低门槛。

这也是OpenAI等AI巨头闭源的思路,因其自身技术的绝对领先优势,使得其价值也非常的大。

相比之下,开源大模型除了快速迭代、证明自己的价值,还面临着更多的挑战,比如:

由于源代码的公开性,开源大模型可能更容易受到恶意攻击或滥用,确保数据安全和用户隐私需要额外的努力和监管。

同时,来自商业模式的不确定性,如何在保持开放的同时实现可持续的商业发展,始终是开源需要解决的重要问题。

回顾历史,红帽在开源商业化成功的道路上已做出了示范。作为最早通过提供企业级 Linux 发行版和相关服务的公司,红帽通过订阅模式为客户提供技术支持、更新和定制化服务。

红帽的商业化路径具体而言:在最上游的开源社区,参与开源技术贡献,做大做强生态;提取开源社区中的上游技术产品,沉淀到自己小开源社区;再将其认为最有价值的技术检验、测试、打包,形成新的产品组合,完成闭源出售给客户。

同样将开源成功商业化的公司还有MongoDB, Databricks, Cloudera, GitLab, Docker, MySQL AB…这些案例都表明,开源软件可以通过提供增值服务、技术支持、企业级特性、云服务等方式实现商业化,同时保持与开源社区的互动和合作。

尽管珠玉在前,但并不代表开源大模型商业化是一件容易的事。

在如此多的开源大模型竞争压力下,如何提高自身大模型在用户中的知名度和接受度,让用户从免费使用转向付费服务,同时还要防止竞争对手可能基于相同的代码库创建自己的产品或服务,都考验着开源大模型厂商的能力和速度。

开源与闭源大模型的协同演化

实际上,开源大模型和闭源大模型各有优劣,且在不同的应用场景和需求下各有其适用性,两者并非绝对的对立面,而是可以在某些方面相互借鉴和融合。

开源是为了保持社区的繁荣和多样性,能够保证技术、产品能够源源不断补充新鲜的血液和产生新的变化。

闭源的商业化版本是用来满足商业化的需求,即安全、低成本、高效、持续有价值的服务。对比商业版本,开源版本一定是滞后的,包括技术的迭代、维护等等。

因此,两者的优势并不在同一个位置,也很难断言哪一个模式将完全主导大模型的未来。相反,可以预见的是,开源和闭源大模型将在以下几个方面实现协同演化:

一是,共享与竞争并存。

开源大模型和闭源大模型将在某些领域展开激烈的竞争,如自然语言处理、计算机视觉等。同时,它们也可能在其他领域共享成果和技术,推动整个AI行业的进步。

二是,混合模式的出现。

为了兼顾创新速度、透明度、安全性和商业利益,一些公司可能会选择采用混合模式,即开放基础模型的源代码,但保留高级功能或特定应用的闭源。

这种模式既可以吸引开发者和用户的参与,又可以保护公司的核心竞争力。

三是,标准化与监管的加强。

随着AI技术的发展和应用的普及,政府和行业组织可能会加强对开源和闭源大模型的标准化和监管工作,以确保模型的安全、公平和透明。

这将进一步规范市场行为,促进开源和闭源大模型的健康发展。

结语

当然,无论是开源还是闭源,重要的是持续创新、提升透明度和安全性,以及实现AI技术的社会价值和经济价值的最大化。比起断定谁会是大模型的未来,不如去关注如何合理利用这两种模式,去塑造一个更加智能、开放、安全和可持续的AI未来。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1335753.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FL Studio 21最新版本for mac 21.2.2.3470中文解锁版

FL Studio 21最新版本for mac 21.2.2.3470中文解锁版是最新强大的音乐制作工具。它可以与所有类型的音乐一起创作出令人惊叹的音乐。它提供了一个非常简单且用户友好的集成开发环境(IDE)来工作。这个完整的音乐工作站是由比利时公司 Image-Line 开发的。…

k8s实战之ELK日志管理

首先查看总体流程 首先创建namespace apiVersion: v1 kind: Namespace metadata:name: kube-logging 一、首先创建es.yaml --- apiVersion: v1 #kubernetes API版本,采用最新版本v1 kind: Service #资源类型定义为Service metadata: name: elasticsearch-logging # …

11.1Linux串口应用程序开发

UART简介 UART的全称是Universal Asynchronous Receiver and Transmitter,即异步发送和接收。 串口在嵌入式中用途非常的广泛,主要的用途有: 打印调试信息;外接各种模块:GPS、蓝牙; 串口因为结构简单、稳…

Angular 进阶之五: Signals到底用不用?

Angular 在V16的时候推出了Signals,在17正式作为主打功能之一强烈推荐,看过了各种博主的各种科普文章也没说明白,到底这东西值不值得用?毕竟项目大了,重构代码也不是闹着玩儿的。各种科普文章主要在说两点:…

自定义注解 - java文档生成、结合SpringBoot使用

参考资料: 参考视频 拦截器自定义注解 AOP自定义注解 通过AOP获取属性 拦截器、过滤器、AOP的区别和联系 个人学习笔记及源码 注:这里仅讲怎么使用,具体原理请参考个人学习笔记 自定义注解源码介绍: 其中视频例子2为上述参…

智能优化算法应用:基于减法平均算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于减法平均算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于减法平均算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.减法平均算法4.实验参数设定5.算法结果6.…

[C/C++]数据结构 希尔排序

🥦前言: 希尔排序也称 “缩小增量排序”,它也是一种插入类排序的方法,在学习希尔排序之前我们首先了解一下直接插入排序. 一: 🚩直接插入排序 1.1 🌟排序思路 直接插入排序的基本原理是将一条记录插入到已排好的有序表中&#x…

微信小程序开发系列-01创建一个最小的小程序项目

本文讲述了通过微信开发者工具,创建一个新的小程序项目,完全从零开始,不依赖开发者工具的模板。目的是为了更好的理解小程序工程项目的构成。 文章目录 创建一个空项目app.json全局配置pagessitemapLocation app.js 创建一个空项目 打开微信…

Android 11.0 系统默认打开OEM解锁开关功能实现

1.前言 在11.0的系统rom定制化开发中,在9.0系统以后为了设备的安装,系统开始启用oem机制,所以在adb push文件就需要先oem解锁,然后才可以 进行相关操作,所以就需要默认打开oem解锁的开关,来方便oem解锁功能的实现 如图: 2.系统默认打开OEM解锁开关功能实现的核心类 pac…

大数据Doris(四十一):物化视图简单介绍

文章目录 物化视图简单介绍 一、适用场景

Apache Commons Math: 面向Java的数学和统计库

第1章:引言 大家好,我是小黑,咱们今天要聊的是Apache Commons Math这个宝藏级的Java库。为啥说它是宝藏呢?因为它简直就是处理数学问题的瑞士军刀,无论你是要搞统计分析、数值计算,还是解决优化问题&#…

微信小程序备案流程整理

一、备案流程 [找备案入口]–[填主体信息]–[填小程序信息]–[初审]–[短信核验]–[通管局审核] 1,在小程序后台找到备案入口 (1)新的未上架小程序,可以在小程序首页点击【去备案】进入。 (2)已上架小程…

智能优化算法应用:基于袋獾算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于袋獾算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于袋獾算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.袋獾算法4.实验参数设定5.算法结果6.参考文献7.MA…

【Midjourney】Midjourney提示词格式详解

目录 🍇🍇Midjourney是什么? 🍉🍉Midjourney怎么用? 🔔🔔Midjourney提示词格式 🍁 1.模型版本提示词🍁 参数 参数详解 应用示例 🍃 2.风格…

小狐狸GPT付费2.4.9 去除授权弹窗版

后台安装步骤: 1、在宝塔新建个站点,php版本使用7.2 、 7.3 或 7.4,把压缩包上传到站点根目录,运行目录设置为/public 2、导入数据库文件,数据库文件是 /db.sql 3、修改数据库连接配置,配置文件是/.env 4、…

三列布局 css

实现如下图的三列布局: .box {width:1400px;margin:0 auto;padding-bottom:40px;> .left {float:left;width:180px;margin-top:100px;text-align:center;}> .center {float:left;margin-top:100px;margin-left:130px;item-box {float:left;text-align:left;…

RPC(6):RMI实现RPC

1RMI简介 RMI(Remote Method Invocation) 远程方法调用。 RMI是从JDK1.2推出的功能,它可以实现在一个Java应用中可以像调用本地方法一样调用另一个服务器中Java应用(JVM)中的内容。 RMI 是Java语言的远程调用,无法实现跨语言。…

蓝牙物联网通信网络设计方案

随着当前经济的快速发展,社会运行节奏加快,人们更倾向于选择高效的出行方式,而飞机就是其中之一。近年来,全国各地机场的吞吐量不断增长,导致航站楼面积过大,而 GPS全球定位系统在室内感测不到卫星信号无法…

Java开发框架和中间件面试题(5)

44.Tomcat一个请求的处理流程? 假设来自客户的请求为: http://localhost:8080/test/index.jsp请求被发送到本机端口8080,被在那里侦听Copote HTTP/1.1 Connector,然后 1.Connector把该请求交给它所在的Service的Engi…

(GCC) 库的操作

文章目录 预备静态库生成链接环境区别 动态库生成链接环境区别 END参考ar指令 预备 准备两个文件&#xff0c;以最简单的形式进行展示。 add.c int add(int x, int y) {return x y; }main.c 为了方便直接在头文件中声明函数 #include <stdio.h>extern int add(int,…