连Llama3都坐冷板凳,市场正在抛弃开源模型

news2024/11/8 17:52:51

Llama3被亚马逊、微软“打入冷宫”,罪在开源?

俗话说,是骡子是马,牵出来溜溜就知道。

最近,开源大模型届的“汗血宝马”Llama3,似乎要露馅了。

据美国媒体The Information报道,在全球最大云计算服务商亚马逊的AWS平台上,一度被开发者好评如潮的Llama开源大模型竞无人问津,企业用户最喜欢的是Anthropic的闭源大模型Claude。无独有偶,报道称在微软云平台上,Llama也一样坐着冷板凳,销售人员甚至不会主动进行推销。

卖是卖不动了,那作为开源模型最引以为傲的下载量呢?也在跌。

据报道,Meta最新推出的开源大模型Llama 3.1 405B,上线一个月后的下载量仅为360万,比上一代模型降低了40%。

为什么Llama3会一路遇冷?

“假开源”:不知参数、不明算法

在互联网和软件开发时代,开源具有重要意义。开源允许用户自由获取、使用、修改和分发软件的源代码,不仅能降低软件使用成本,还能激发更多的开发者参与到软件的创新和改进中,推动技术的发展迭代。这样“众人拾柴火焰高”的开源精神,是互联网时代最宝贵的财富之一。

但时代变了。如今的开源大模型,都是有限开源——仅开放参数和调用接口,但训练数据、训练代码、算法等这些核心部分都未开源。这就好比让你下厨但不给菜谱,光开放厨房有啥用呢?

百度的李彦宏前一段时间直接炮轰过这个问题,他指出很多人混淆了模型开源和代码开源的概念,所谓的模型开源只能拿到一堆参数,还要再做SFT、安全对齐,即使是拿到对应源代码,也不知道是用了什么样的数据去训练这些参数,并不能实现“站在巨人的肩膀上”的效果做迭代开发。闭源大模型比开源模型明显更适用于商业社会和企业服务市场。

『AI教母』李飞飞带领的斯坦福人工智能团队前几个月公布的测评结果也显示,开源大模型全面落后闭源大模型。尤其是在最能体现模型应用和智能体能力的AgentBench项目上,闭源模型评分为4分,而开源仅为0.96,两者差距高达300%。

不仅能力差,开源大模型还存在一系列问题:

一是海外开源模型大多未经过严格的安全测试,数据、代码都是“黑盒子”,内部的逻辑和决策过程不透明,开发者难以对其进行精确的控制和约束,极易存在安全隐患。

其次,Post-pretrain消耗资源大,开源模型需要企业自行进行精调和优化,没有钞能力的个人玩家和小企业,很难负担起其所需的算力资源、技术开销和人力成本。

“真门槛”:想用开源,算力够吗?

用不起,是Llama3一路遇冷的另一重要原因。

美国知名AI创业者、VRSEN公司的创始人Arsenii Shatokhin在访谈中直言,“我们只有一两个客户有足够资源,来精调或运行700亿参数的Llama开源模型。”

VRSEN是一家专注于为企业客户打造AI智能体的公司,曾为多家知名企业如思科、StripePMA、HUGO PFOHE等提供过AI解决方案。

在结合真实的市场反馈和落地经验后,Arsenii Shatokhin分析出Llama3等开源大模型卖不动的原因——效率低、性价比更低。

他解释说,闭源大模型的API优化效率更高,“因为这些API是专门为模型构建的,并且尽可能地进行了优化,你只需要为你使用的东西付费,而无需其他费用。”与之相对,如果在开源模型中开发这样的优化系统,“是非常复杂的”。

正如谷歌前CEO Eric Schmidt所言,开源是一个好的模式,谷歌历史上的大部分基础设施都受益于开源,但AI行业的成本太高,开源负担不起。同时,开源模型和闭源模型相比,存在性能差距,这种差距还将继续扩大。他强调,自己投资的法国大模型公司Mistral,将会从开源转为闭源路线。

大模型的开源闭源之争,或终将随着Llama 3在市场的持续遇冷得到一个明确的答案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2072728.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024.8.24

130124202408241009 DATE #:20240824 ITEM #:DOC WEEK #:SATURDAY DAIL #:捌月廿壹 TAGS < BGM "风屿&#xff0d;&#xff0d;闫东炜" > < theme oi-graph theory > < [NULL] > < [空] > < [空] > 与风为名&#xff0c;屿之齐鸣。…

MFC工控项目实例之六CFile添加菜单栏

本程序基于前期我的博客文章《MFC工控项目实例之五CFile类读写系统参数》 添加两个对话框如下 具体添加菜单栏参考我的博客文章MFC_ CFile类实现下拉菜单读写实例&#xff08;源码下载&#xff09; 这里给出相关代码 在 SEAL_PRESSURE.h文件中添加 #include <afxtempl.…

github源码指引:共享内存、数据结构与算法

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码目录&#xff1a;shmfc 相…

一键拼图神器CollageIt,让你的照片秒变艺术大作!

前言 嘿&#xff0c;你是否曾对着满屏的照片发愁&#xff0c;想要快速整理成精美的作品集&#xff0c;却又被繁琐的排版搞得头昏脑涨&#xff1f;如果有一款神器&#xff0c;能让你一键搞定这些烦恼&#xff0c;轻松提升办公效率&#xff0c;是不是觉得升职加薪的曙光就在眼前…

Python 进度条tqdm应用记录

tqdm 简介 tqdm 是一个非常流行的 Python 库&#xff0c;用于快速添加进度条到循环中。它可以方便地集成到脚本中&#xff0c;并且支持多种类型的迭代器。 安装 首先确保你安装了 tqdm。如果还没有安装&#xff0c;可以通过 pip 安装它&#xff08;如果要在 jupyter noteboo…

游戏开发设计模式之单例模式

单例模式&#xff08;Singleton Pattern&#xff09;是一种常见的设计模式&#xff0c;其主要目的是确保一个类在整个程序的生命周期中只有一个实例&#xff0c;并提供一个全局访问点来获取这个实例。在游戏开发中&#xff0c;单例模式具有广泛的应用和重要的作用。 单例模式的…

如何评估Redis的性能

如果系统中出现了大 key、热 key 等&#xff0c;往往会导致 Redis 变慢&#xff0c;但是这个慢该如何界定&#xff1f;多久算慢&#xff1f;1秒还是3秒&#xff1f; 这个肯定是没有标准答案&#xff0c;因为这个和你的硬件设备有关。 硬件差一些&#xff0c;平时响应时间都是…

OSPF路由原理详解与关键点

目录 一. OSPF简介: 二. OSPF原理描述: 三. OSPF的核心内容: 四. OSPF的邻居关系和邻接 五. LSA在各区域中传播的支持情况 一. OSPF简介: 开放式最短路径优先OSPF&#xff08;Open Shortest Path First&#xff09;是IETF组织开发的一个基于链路状态的内部网关协议&…

打造编程学习的知识宝库:高效笔记与整理技巧

在编程的海洋中&#xff0c;知识的深度和广度都是难以估量的。要想在这片海洋中航行而不迷失方向&#xff0c;一个高效的笔记系统是不可或缺的。本文将探讨如何建立一个既能快速记录又易于回顾的笔记系统&#xff0c;以及如何在繁忙的学习中保持笔记的条理性。 目录 一、确定笔…

数三角形(二)》-筛除法斜线结论

算法思路&#xff1a; 1、一个直观的思路是筛除法&#xff0c;即&#xff1a;答案总数-三点共线的种数 总数易求得&#xff0c;为组合数C((n1)*(m1),3)&#xff0c;考虑到n、m数值范围&#xff0c;考虑用long long。 2、三点共线的情况有&#xff1a; &#xff08;1&#xff09…

Linux驱动学习之按键读取

按键读取我们需要实现read函数&#xff0c; read 函数的 第二个参数被__user 修饰&#xff0c;原则上在内核层我们不能直接访问&#xff0c;需要调用 copy_to_user()这个函数&#xff0c;从内核获取数据到上层。 copy_to_user(void __user volatile * to, const void * from,…

C语言笔试题(指针、数组、整数在内存中的存储、结构体......)

文章目录 1.选择题2.代码题2.1 模拟实现strncat2.2 模拟实现strncpy2.3 编写判断大小端程序2.4 模拟实现atoi2.5 BC38 变种水仙花数2.6 BC98 序列中删除指定数字 今天我们一起来看一些题目 1.选择题 解析如下&#xff1a; 正确选项&#xff1a;B A.参数错误&#xff1b;D.返回…

什么是Redis集群的脑裂问题?

目录 一、脑裂的发生 二、脑裂的危害 三、如何避免脑裂&#xff1f; 四、能彻底解决脑裂吗&#xff1f; 所谓脑裂&#xff0c;就像他的名字一样&#xff0c;大脑裂开了&#xff0c;一般来说就是指一个分布式系统中有两个子集&#xff0c;然后每个子集都有一个自己的大脑(Le…

【Excal】And函数

奖金评定说明 业绩低于6000&#xff0c;奖金为100 业绩大于等于6000且小于10000&#xff0c;奖金为200 业绩大于等于10000&#xff0c;奖金为500 然后按回车健 下拉填充

BurpSuite2024.7.3专业版

前言 Burp Suite是一个无需安装软件&#xff0c;下载完成后&#xff0c;直接从命令行启用即可。开箱即可使用支持LInux/Windows/Mac 01更新介绍 2024.7.13版本界面大改动此版本引入了重大的性能升级、对拦截功能的重大增强&#xff0c;以及在审计项目表中新增了扫描插入点列。…

【Nature】在科研中应用ChatGPT:如何与数据对话

随着人工智能技术的迅猛发展&#xff0c;大型语言模型&#xff08;LLMs&#xff09;正逐渐成为科研领域的一种创新工具。这些模型通过自然语言处理技术&#xff0c;使得研究人员能够以直观的方式与数据进行交互&#xff0c;从而简化了数据分析和解释的过程。在《自然》杂志2024…

103.二叉树的锯齿形层序遍历

1.题目描述 给你二叉树的根节点 root &#xff0c;返回其节点值的 锯齿形层序遍历 。&#xff08;即先从左往右&#xff0c;再从右往左进行下一层遍历&#xff0c;以此类推&#xff0c;层与层之间交替进行&#xff09;。 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,nul…

Unity-可分组折叠的Editor

Unity-可分组折叠的Editor &#x1f957;功能介绍&#x1f36d;用法 &#x1f957;功能介绍 在序列化的字段上标记特性:[FoldoutGroup(“xxx”)]&#xff0c;inspector上就会被分组折叠显示。 &#xff08;没有被指定的字段自动放到Default组中&#xff09; 传送门&#x1f30…

如何用Java SpringBoot和Vue搭建高效的OA办公管理系统?

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java实战 |…

深度学习--复制机制:CopyNet 模型在序列到序列模型中的应用以及代码实现

CopyNet 是一种特别设计的序列到序列&#xff08;Seq2Seq&#xff09;模型&#xff0c;旨在更好地处理那些在输出序列中需要直接复制输入序列中的部分或全部内容的任务。它在机器翻译、摘要生成、文本复述等任务中有广泛的应用&#xff0c;尤其是在输入和输出有显著重叠的场景。…