生成式AI竞赛:开源还是闭源,谁将主宰未来?

news2025/1/11 5:41:11

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

对于一些行业观察家来说,这场战斗似乎还没开始就已结束。当ChatGPT成为有史以来增长最快的应用程序,在仅仅存在两个月内就达到了1亿用户时,它提出了一个严肃的可能性——OpenAI和GPT-4可能会在大多数世界意识到比赛已经开始之前就占据市场。

并不是说1亿用户是一个不可逾越的用户基础。毕竟,谷歌搜索每个月有超过十五亿独立用户。这也不是ChatGPT品牌力量的问题(尽管作为流行文化中唯一广为人知的AI应用程序肯定有所帮助)。真正的优势在于数据。

“数据”包括用户和AI之间数亿次互动期间发生的一切。它包括使用模式、提示文本和新出现的问题。有了足够的数据,你可以构建一个不断完善和改进AI模型的良性反馈循环。数据是Bing无法挑战谷歌搜索的原因,尽管投入了数十亿美元和一半多十年的努力。拥有谷歌十分之一用户流量的Bing,永远限制在一个更小的洞察窗口,并且拥有更少的信息来微调其搜索算法。

所以,这是对未来生成式AI竞赛的最佳初步猜测。谁获得最多的数据,并将其投入到持续改进的循环中,谁就是赢家。

但事实并非如此。

先发优势正在消退


今天,我们看到一系列公司几乎每周都在发布惊人的新AI创新。最近的是Antrophic的Claude 3,一个在关键基准测试中击败GPT-4的LLM,比如生成代码的人类评估质量。(它今天可以在亚马逊Bedrock上获得。)上周是谷歌的Gemini,具有巨大的上下文窗口、可适应的代码生成和视频识别能力。在那之前的几周,我们看到了OpenAI的Sora的演示,它将文本转换成视频中的富有想象力的世界。Meta的Llama 3只有几个月的时间,提供几乎我们现在拥有的一切,而且是免费的。甚至苹果也在暗示其自己的秘密多年AI努力,它用来创建一个具有2000亿参数的内部GPT。

简而言之,世界上最富有和最先进的科技公司正在将它们庞大的资源投入到生成式AI中。我们开始看到一个模式,一个产品中的突破性功能被另一个产品复制然后超越。当前的共识已经转变,许多专家现在预计,随着模型的成长和领域的前进,最好的大型LLM将越来越相似。

如果几家公司有能力构建可以与行业最佳竞争的系统,谁会赢得生成式AI竞赛?如果OpenAI首先到达那里,而谷歌可以迅速跟进一个可比产品,这有关系吗?哪个科技巨头或灵活的AI初创公司拥有未来?

开源的吸引力


商业中有一个理论叫做创新者的困境,它解释了为什么领先公司会输给新兴挑战者。占主导地位的公司看到地平线上接近的竞争对手,但他们低估了风险,因为他们知道他们的产品质量更优。但问题在于。通常并不是纯粹的技术质量赢得了竞赛。如果竞争对手能够为市场上90%的人提供一个“足够好”的产品,而成本只有十分之一,它可以改变游戏规则。老牌公司可能会围绕剩下的(仍然有利可图的)10%的市场关闭行列,这部分市场仍然要求最好的最好。但他们的观众会年复一年地缩小,他们的死亡螺旋就开始了。

如果我们在AI中达到这样的转折点,情绪可能会迅速改变。闭源LLM的吸引力可能会在一夜之间几乎消失。我们已经看到AI生态系统中的重大转变。不久前,我们还在争论是否有人会用可比的开放模型挑战像GPT-4这样的大型LLM。人们对保护专有研究的担忧很严重,并且担心潜在的误用。但秘密很快就泄露出来了,像Llama 2这样的有能力的模型随之而来。现在第一个问题不是“OpenAI或谷歌或Anthropic的闭源产品有多好?”而是“Llama对我的用例来说足够好了吗?”和“尝试一下有什么坏处?”

“当免费、不受限制的替代品在质量上可比时,人们不会为受限模型付费。”

开源AI的局限


如果这是整个情况,结论将是显而易见的。最终和不可避免地,开源AI模型将超越它们的闭源表亲。然而,还有一些其他的问题需要考虑。首先,开源AI并不完全是开源的——至少不是以传统意义上的。

当我们谈论开源软件时,我们知道这意味着什么:每一位代码都是可供你检查甚至改变的。但当我们谈论开源AI模型时,承诺并不那么清楚。我们知道我们可以下载模型。我们可能可以访问其他细节,比如训练权重。然而,训练数据通常是保密的,这意味着开源模型是无法复制的。开源访问使得研究和理解AI模型变得更容易——并且可以在其上进行创新;例如,使用新的微调技术(如LoRA)。但只到某种程度。考虑Llama 2。它是不透明的。复制它的成本是禁止性的。而且它由一个巨大的公司控制,这个公司只会因为更多的开发者进入其生态系统而受益。

而且Llama 2没有使用规范的开源许可证,如Apache。Meta特别禁止某些类型的使用,比如使用Llama训练另一个模型。像这样的限制导致AI研究人员声称,像Llama这样的模型几乎没有为民主化访问做出贡献,反而更多地将权力集中在模型创建者手中。有些人称Meta的做法为开放洗白——换句话说,是使用开源的说法来洗掉底层闭源做法的污点。

有一些由基金会和非营利组织创建的较小模型,比Llama更开放,尽管能力较弱。但即便这些模型也遇到了一个重大障碍。分享一个AI模型很容易,但分享支持它们的AI基础设施要困难得多。这是生成式AI的最后挑战:计算能力的战斗。

赢家是拥有计算能力的人吗?

开源AI拥有是免费的,但运行并非免费。当然,所有软件都是如此,但在大型模型和AI驱动的应用程序的情况下,计算和内存需求可能是惊人的。在内部运行AI系统存在重大障碍。如果你 anyway需要一个云提供商来托管你的AI基础设施,那么支付AI计算基础设施和支付使用AI模型的区别可能看起来并不特别重要。

如果你正在考虑训练自己的模型,差距更大。即使你知道你需要重新构建一个开源模型的一切,你可能也缺乏预算和数据科学专业知识。理论上是开放的。

今天,世界上只有少数公司拥有专业硬件和资源来训练世界级的LLM。

这就是我们今天的位置。但LLM还不是成熟的产品,变化的速度还没有放缓到接近普通生活的程度。实际上,LLM正在同时朝两个方向发展——一方面变得更强大,另一方面变得更精简。不久我们将有选择使用nano LLM,我们可以在当前手机硬件上舒适地运行它。现在还为时过早,无法说未来的发展将围绕哪里工作的LLM还是坐落在价值万亿美元的科技公司中心、作为服务出租的庞大模型。

今天,我的赌注是不断扩展的开源AI社区中的进步将占上风。但这只代表一个可能的未来。胜者仍可能由单个闭源模型的突然能力跃进决定,或许是另一种类型的生成式AI(如文本到视频)。或者也许一个在开源生态系统中出现的激进新工具将解决看似难以解决的问题,使先进的AI系统变得更加容易获取和部署,比今天更是如此。我们只需要再等一点时间就能发现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1524541.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024抖音矩阵云混剪系统源码 短视频矩阵营销系统

2024抖音矩阵云混剪系统源码 短视频矩阵营销系统 矩阵营销系统多平台多账号一站式管理,一键发布作品。智能标题,关键词优化,排名查询,混剪生成原创视频,账号分组,意向客户自动采集,智能回复&am…

Python基础(七)之数值类型集合

Python基础(七)之数值类型集合 1、简介 集合,英文set。 集合(set)是由一个或多个元素组成,是一个无序且不可重复的序列。 集合(set)只存储不可变的数据类型,如Number、…

uwsgi+nginx+django 部署学习

收集静态文件及部署配置 DEBUG False STATICFILES_DIRS [os.path.join(BASE_DIR, "static"), ] STATIC_ROOT /data/static python3 manage.py collectstatic 收集静态文件,成功后可在STATIC_ROOT目录查看 安装依赖 pip3 install uwsgi django项目结…

docker基础用法-2

文章目录 什么是dockerOCI&OCFOCIOCF docker架构docker镜像与镜像仓库docker对象安装及使用dockerdocker安装docker加速docker常用操作docker event state防火墙状态及规则 什么是docker docker中的容器: lxc --> libcontainer --> runC docker最开始是…

嵌入式学习之Linux系统编程篇笔记——系统编程初探

配套视频学习链接:https://www.bilibili.com/video/BV1zV411e7Cy?p2&vd_sourced488bc722b90657aaa06a1e8647eddfc 目录 Linux系统编程的基本认识 什么是Linux系统编程? 什么是系统编程 系统编程的作用 怎么学习Linux系统编程? Linux系统编程基本程序框…

数据可视化学习:Matplotlib概述

一、图表的常用设置 1.基本绘图主要函数 (1).matplotlib.pyplot.plot(x,y,format_string,**kwargs) 2.参数说明 (1).x:x轴数据 (2).y:y轴数据 (3).format_string:控制曲线格式的字符串,包括颜色、线条样式和标记样式 (4)**kwargs:键值参数,相当于…

IDEA : 已经有一个永久破解版的IDEA2019版本,现在又想安装最新版本的,俩版本共存,发现新版本打不开的解决方案

在新文件的目录下,注释掉一行19版本的地址 地址:C:\Users\23999\AppData\Roaming\JetBrains\IntelliJIdea2023.2 (不同电脑Users后边的一个地址的注释会不一样) 然后找到该目录下的indea64.exe.vmoptions 用 记事本 打开 在-javaagent 那一栏里会自动给…

如何学习一个大型分布式Java项目

前言 很多同学在没有实习经验的时候看到一个多模块分布式项目总是有一种老虎吃天的无力感,就像我刚毕业去到公司接触项目的时候一样,模块多的夸张,想学都不知道从哪开始学,那么我们拿到一份代码后如何从头开始学习一个新项目呢。…

ThingsBoard Edge 设备控制

文章目录 一、RPC 功能1.服务端 RPC2.客户端 RPC3.MQTT RPC API3.1.服务端RPC3.2.客户端RPC 二、设备控制1.环境准备2.创建设备3.服务端PRC3.1.RPC消息主题3.2.程序源码3.3.创建仪表板3.4.边缘分配仪表板3.5.测试 4.客户端RPC4.1.RPC消息主题4.2.程序源码4.3.规则链4.4.测试 Th…

Selenium-webdriver_manager判断是否已经下载过驱动(复用缓存驱动)

1,谷歌浏览器默认位置 2,ChromeDriverManager 下载的驱动位置 其中admin为机器的用户名 def installDriver(self):"""判断是否需要下载driver""""""找到本机谷歌浏览器版本""""""C:\P…

软考81-上午题-【面向对象技术3-设计模式】-行为型设计模式01

一、行为型设计模式一览 二、责任链模式 2-1、意图 使多个对象都有机会处理请求,从而避免请求的发送者和接收者之间的耦合关系。将这些对象连成一条链,并沿着这条链传递该请求,直到有一个对象处理它为止。 1-2、结构 1-3、代码实现 1-4、适…

Kubectl常用命令

管理资源(查看、创建、更新、删除) 查看node资源 kubectl get nodes查看命名空间 kubectl get ns查看service资源 -n 指明所属的命名空间,不写默认看命名空间为default下的所有service kubectl get svc -n default查看pod资源 -n 指明所…

万界星空科技商业开源MES,技术支持+项目合作

商业开源的一套超有价值的JAVA制造执行MES系统源码 亲测 带本地部署搭建教程 教你如何在本地运行运行起来。 开发环境:jdk11tomcatmysql8springbootmaven 可以免费使用,需要源码价格便宜,私信我获取。 一、系统概述: MES制造执…

网络安全实训Day5

写在前面 昨天忘更新了......讲的内容不多,就一个NAT。 之前记的NAT的内容:blog.csdn.net/Yisitelz/article/details/131840119 网络安全实训-网络工程 NAT 公网地址与私网地址 公网地址 可以在互联网上被寻址,由运营商统一分配全球唯一的I…

Coursera上Golang专项课程2:Functions, Methods, and Interfaces in Go 学习笔记

Functions, Methods, and Interfaces in Go Course Certificate 本文是学习 Functions, Methods, and Interfaces in Go 这门课的学习笔记,如有侵权,请联系删除。 文章目录 Functions, Methods, and Interfaces in GoMODULE 1: FUNCTIONS AND ORGANIZ…

云原生部署手册02:将本地应用部署至k8s集群

(一)部署集群镜像仓库 1. 集群配置 首先看一下集群配置: (base) ➜ ~ multipass ls Name State IPv4 Image master Running 192.168.64.5 Ubuntu 22.04 LTS1…

多进程数据库不适合作为hive的元数据库

简介 “今天发现一个比较奇怪的现象,因为博主不熟悉mysql,所以在安装hive的使用了postgresql作为hive的元数据库,在测试几个连接工具对hive进行链接,后面再测试的时候发现链接不上了,并且报错日志如下:” …

利用生成式人工智能进行功能管理测试

就 DevOps 而言,生成式 AI与功能管理测试的新兴集成标志着一次重大演变。我们将认真研究这项技术如何彻底改变我们创建测试环境的方式。 使用人工智能生成测试使我们能够模拟大量的用户场景和环境,这意味着我们可以开发和部署不仅好而且很棒的功能&…

django实现api接口

(前期准备)第一步:虚拟环境 在windows上使用virtualenvwrapper。 pip install virtualenvwrapper-win 接着,添加环境变量。 echo %WORKON_HOME% 接下来就是创建虚拟环境,假如创建myenv mkvirtualenv myenv 进入…

线程的基本使用

线程 使用线程方法 继承Thread类,重写run方法实现Runnable接口,重写run方法 继承Thread vs 实现Runnable的区别 从java的设计来看,通过继承Thread或者实现Runnable接口来创建线程本质上没有区别,从jdk帮助文档可以看到Thread类本身就实现…