“开源AI”到底是什么意思

news2024/11/19 9:28:56

开源与专有软件之间的斗争早已为人所熟知。然而,长期以来弥漫在软件圈的紧张关系已经渗透到了人工智能领域,部分原因在于没有人能在AI背景下就“开源”的真正含义达成一致。

相关阅读:GPT-4o通过整合文本、音频和视觉实现人性化的AI交互,OpenAI推出了其新的旗舰模型GPT-4o,它无缝整合了文本、音频和视觉输入与输出,有望提高机器交互的自然性。现在Plus用户可以直接使用GPT-4o,关于如何开通Plus,可以使用WildCard平台。或者可以使用镜像站,已实现所有功能(包括实时语音对话)。

《纽约时报》最近发表了一篇对Meta CEO马克·扎克伯格的溢美之词,指出他对“开源AI”的拥抱使他在硅谷重新受欢迎。然而,大多数估计认为,Meta的Llama品牌的大型语言模型并不是真正的开源,这突显了争论的核心。WildCard也支持Claude, Midjourney, Adobe, Patreon, Midjourney, OF, X等的订阅。

正是这一挑战促使开源倡议(OSI)试图解决这个问题,其执行董事斯特凡诺·马夫弗利(如上图)通过会议、研讨会、小组讨论、网络研讨会、报告等方式进行努力。

AI不是软件代码

OSI已经管理开源定义(OSD)超过四分之一个世纪,规定了“开源”一词在软件中的适用和应当应用的方式。符合这一定义的许可证可以合法地被认为是“开源”,尽管它承认存在从极其宽松到不那么宽松的许可证谱系。

但将软件中的遗留许可和命名惯例移植到AI上是有问题的。开源倡导者、风投公司OSS Capital创始人约瑟夫·杰克斯甚至表示,“不存在开源AI这种东西”,指出“开源是专为软件源代码发明的。”进一步说,“神经网络权重”(NNWs)——这是人工智能领域用来描述在训练过程中网络学习的参数或系数的术语——在任何有意义的方式上都无法与软件相比。

“神经网络权重不是软件源代码;它们对人类不可读,也无法调试,”杰克斯指出。“此外,开源的基本权利也不能以任何一致的方式转移到NNWs上。”

正是这些不一致性去年促使杰克斯和OSS Capital同事希瑟·米克尔提出了自己的定义,围绕“开放权重”的概念展开。马夫弗利对此也表示赞同。“这个观点是正确的,”他告诉TechCrunch。“我们最初的辩论之一是是否要将其称为开源AI,但每个人都已经在使用这个术语了。”

Meta分析

成立于1998年的OSI是一家非营利公共利益公司,围绕倡导、教育和其核心存在理由:开源定义,进行各种开源相关活动。如今,该组织依靠赞助进行资助,其成员包括亚马逊、谷歌、微软、思科、英特尔、Salesforce和Meta等。

Meta目前与OSI的关系尤其值得注意,因为它涉及到“开源AI”的概念。尽管Meta将其AI挂在开源的名义上,但该公司对其Llama模型的使用有显著的限制:当然,它们可以免费用于研究和商业用途,但每月用户超过7亿的应用开发者必须向Meta申请特别许可证,而Meta将完全自行决定是否授予该许可证。

Meta对其LLMs的语言有些灵活。虽然公司确实称其Llama 2模型为开源,但随着Llama 3的到来,该公司在术语上有所退缩,使用了“开放可用”和“开放可访问”等短语。然而,在某些地方,它仍将该模型称为“开源”。

“参与讨论的每个人都完全同意Llama本身不能被视为开源,”马夫弗利说。“我与Meta工作的人的对话中,他们知道这有点牵强。”

此外,有人可能会认为这里存在利益冲突:一家希望借用开源品牌的公司同时也为“定义”的管理者提供资金?

这也是OSI试图多样化其资金来源的原因之一,最近获得了斯隆基金会的资助,帮助其推动全球多方利益相关者达成开源AI定义。TechCrunch透露,这笔资助约为25万美元,马夫弗利希望这能改变其对企业资金依赖的印象。

“这正是斯隆资助使之更加清晰的事情之一:我们随时可以告别Meta的钱,”马夫弗利说。“即使在斯隆资助之前,我们也可以做到这一点,因为我知道我们将获得其他人的捐赠。Meta非常清楚这一点。他们没有干涉这一过程,微软、GitHub、亚马逊或谷歌也没有干涉——他们绝对知道他们不能干涉,因为组织的结构不允许这样做。”

开源AI的工作定义

image-20240624101843103

当前的开源AI定义草案版本为0.0.8,包含三个核心部分:引言,概述了文件的范围;开源AI定义本身;以及检查表,列出了开源合规AI系统所需的组件。

根据当前草案,开源AI系统应允许用户在不寻求许可的情况下出于任何目的使用系统;允许他人研究系统的工作原理并检查其组件;以及修改和共享系统以任何目的。

但最大的挑战之一是数据——也就是说,如果公司没有提供训练数据集供他人检查,AI系统是否可以被归类为“开源”?根据马夫弗利的说法,了解数据的来源以及开发者如何标记、去重和过滤数据更为重要。同时,还要了解用来从各种来源组装数据集的代码。

“知道这些信息比单纯的数据集要好得多,”马夫弗利说。

虽然访问完整的数据集会很好(OSI将其视为“可选”组件),但马夫弗利表示,在许多情况下这是不可能或不实际的。这可能是因为数据集中包含了开发者没有权限重新分发的机密或受版权保护的信息。此外,还有一些训练机器学习模型的技术,其中数据本身实际上并未与系统共享,如联邦学习、差分隐私和同态加密。

这正好突显了“开源软件”和“开源AI”之间的根本区别:意图可能相似,但它们并不完全可比,这种差异正是OSI试图在其定义中捕捉的。

在软件中,源代码和二进制代码是同一工件的两种视图:它们以不同形式反映同一个程序。但训练数据集和随后的训练模型是不同的东西:你可以使用同一个数据集,但不一定能一致地重新创建同一个模型。

“在训练过程中发生的各种统计和随机逻辑意味着它不能像软件一样具有可重复性,”马夫弗利补充道。

因此,开源AI系统应该易于复制,并有明确的说明。这就是开源AI定义检查表的作用,该检查表基于最近发表的一篇学术论文《模型开放性框架:促进人工智能的可复现性、透明度和可用性的完整性和开放性》。

这篇论文提出了模型开放性框架(MOF),一个基于模型完整性和开放性对机器学习模型进行评分的分类系统。MOF要求AI模型开发的特定组件“在适当的开源许可证下包含并发布”,包括训练方法和模型参数的详细信息。

稳定的条件

Stefano Maffulli 在亚的斯亚贝巴举行的数字公共产品联盟 (DPGA) 成员峰会上发表讲话

OSI称定义的正式发布为“稳定版本”,就像一个公司在应用程序经过广泛测试和调试后准备好投放市场时所做的那样。OSI故意不称其为“最终发布”,因为其部分内容可能会不断发展。

“我们不能指望这个定义像开源定义一样持续26年,”马夫弗利说。“我不认为定义的顶部部分——例如‘什么是AI系统?’——会有很大变化。但我们在检查表中提到的部分,那些组件列表取决于技术?明天,谁知道技术会是什么样子。”

稳定的开源AI定义预计将在10月底的All Things Open会议上由董事会批准,在此期间,OSI将在全球范围内进行巡回演讲,横跨五大洲,寻求更多关于“开源AI”定义的“多样化输入”。但任何最终的更改可能只是一些“小调整”。

“这是最后的冲刺,”马夫弗利说。“我们已经达到了定义的功能完整版本;我们有了所有需要的元素。现在我们有了检查表,所以我们正在检查其中没有意外;没有系统应该包含或排除。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1856692.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

上海舆情分析软件的功能和对企业的意义

随着互联网的飞速发展,人们参与讨论、发声的途径与评率也越来越多,在为自己发声的同时,公众舆论也成为企业获取民意,改进发展的重要参考。 上海 舆情分析软件的开发,为企业获取舆论,调查研究提供了便捷化的…

Spring+SpringMVC+MyBatis整合

目录 1.SSM介绍1.1 什么是SSM?1.2 SSM框架1.2.1 Spring1.2.2 SpringMVC1.2.3 MyBatis 2.SSM框架整合2.1 建库建表2.2 创建工程2.3 pom.xml2.4 log4j.properties2.5 db.properties2.6 applicationContext-dao.xml2.7.applicationContext-tx.xml2.8 applicationContex…

浅析缓存技术

缓存技术的原理 缓存技术通过在内存中存储数据副本来加速数据访问。当应用程序需要数据时,首先检查缓存是否存在数据副本,如果有则直接返回,否则再从原始数据源获取。这种机制大大减少了访问时间,提升了系统的响应速度和整体性能。…

Maven深度解析:Java项目构建

Maven是一个由Apache软件基金会维护的软件项目管理和理解工具,它主要服务于基于Java的软件项目。。 Maven深度解析:Java项目构建 引言 在Java开发领域,项目构建和管理是一个复杂而关键的任务。Maven作为这一领域的佼佼者,以其声…

vscode下无法识别node、npm的问题

node : 无法将“node”项识别为 cmdlet、函数、脚本文件或可运行程序的名称 因为node是在cmd安装的,是全局安装的,并不是在这个项目里安装的。 解决方案: 1.在vscode的控制台,针对一个项目安装特定版本的node; 2.已经…

基于Dify的智能分类方案:大模型结合KNN算法(附代码)

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步,扬帆起航。 大模型应用向开发路径:AI代理工作流大模型应用开发实用开源项目汇总大模…

Spring中事务的传播机制

一、前言 首先事务传播机制解决了什么问题 Spring 事务传播机制是包含多个事务的方法在相互调用时,事务是如何在这些方法间传播的。 事务的传播级别有 7 个,支持当前事务的:REQUIRED、SUPPORTS、MANDATORY; 不支持当前事务的&…

华为某员工爆料:偷偷跑出去面试,被面试官鄙视了。第一句话就问:华为淘汰的吧,35岁了,这个年龄在华为能混得下去吗?身体没啥毛病吧

“你都35岁了,难不成是被华为淘汰的?在华为混不下去了吧?身体没啥毛病吧,我们这体检可是很严的。” 近日,一位华为员工在朋友圈爆料,自己在面试时遭到了面试官的无理取闹和人身攻击,原因仅仅是因…

中东文明史

转自:想要了解完整的中东文明史?这篇文章成全你 - 知乎 (zhihu.com) 写在前面 中东文明是人类历史上最古老的文明。人类祖先从东非大裂谷走出之后,首先选择定居在中东地区的新月沃土上,并建立了人类历史上有文字记载的第一个文明…

利用Frp实现内网穿透(docker实现)

文章目录 1、WSL子系统配置2、腾讯云服务器安装frps2.1、创建配置文件2.2 、创建frps容器 3、WSL2子系统Centos服务器安装frpc服务3.1、安装docker3.2、创建配置文件3.3 、创建frpc容器 4、WSL2子系统Centos服务器安装nginx服务 环境配置:一台公网服务器&#xff08…

【zabbix】zabbix客户端配置

1、部署zabbix客户端 #zabbix 5.0 版本采用 golang 语言开发的新版本客户端 agent2 。 #zabbix 服务端 zabbix_server 默认使用 10051 端口,客户端 zabbix_agent2 默认使用 10050 端口。 systemctl disable --now firewalld setenforce 0 hostnamectl set-hostname…

C语言 | Leetcode C语言题解之第171题Excel表列序号

题目: 题解: int titleToNumber(char* columnTitle) {int number 0;long multiple 1;for (int i strlen(columnTitle) - 1; i > 0; i--) {int k columnTitle[i] - A 1;number k * multiple;multiple * 26;}return number; }

【Linux 基础】文件与目录管理

1. 文件和目录的基本概念 文件:是数据的集合,可以是文本、图像、视频等。 目录(也称为文件夹):是文件和子目录的集合,用于组织文件。 2. 目录和路径 绝对路径:从根目录(/&#x…

已经被驳回的商标名称还可以申请不!

看到有网友在问,已经驳回的商标名称还可以申请不,普推商标知产老杨觉得要分析看情况,可以适当分析下看可不可以能申请,当然最终还是为了下证 ,下证概率低的不建议申请。 先看驳回理由,如果商标驳回是绝对理…

Spring Boot 学习第七天:动态代理机制与Spring AOP

1 概述 在Java的世界中,实现AOP的主流方式是采用动态代理机制,这点对于Spring AOP也一样。代理机制的主要目的就是为其他对象提供一种dialing以控制对当前对象的访问,用于消除或缓解直接访问对象带来的问题。通过这种手段,一个对象…

Java | Leetcode Java题解之第169题多数元素

题目: 题解: class Solution {public int majorityElement(int[] nums) {int count 0;Integer candidate null;for (int num : nums) {if (count 0) {candidate num;}count (num candidate) ? 1 : -1;}return candidate;} }

(2011-2022年) 全国各省快递业务量与快递业务收入面板数据

中国快递业近年来随着电子商务的蓬勃发展而迅速壮大,成为现代生活中不可或缺的一部分。快递业务量与收入的面板数据为我们提供了一个观察中国快递市场繁荣与多元化的窗口。 数据来源 中国统计年鉴 参考文献 胡润哲, 魏君英, 陈银娥. 数字经济发展对农村居民服务…

如何把文件扫描成电子版pdf?这4个方法包教包会~

大多数时候,我们为了更加方便存档与文件共享,都会借助专用的扫描仪来把文件扫描成PDF文档~但其实现在想要扫描文件并不是只有扫描仪能够搞定,还有很多的方法和工具都能够代替它来一一实现。 就好比下面罗列出来的四大文件扫描方法&#xff0…

【STM32学习】基于I2C协议的OLED显示(利用U8G2库)

目录 一、I2C协议、时序协议 1.1 I2C协议: 1.2时序协议: 二、OLED原理 2.1主流显示面板技术 2.2OLED发光原理: 2.3汉字点阵显示原理 三、U8G2 四、代码移植 4.1创建工程(HAL库): 4.1.1CubexMX配置…

Gemalto加密狗的优势

Gemalto加密狗,作为硬件加密技术的杰出代表,为软件开发商和用户提供了一种高效、安全的解决方案。这种加密狗不仅拥有卓越的加密性能,还具备易用性和可靠性,是保护软件知识产权和防止非法复制的重要工具。 一、Gemalto加密狗的核心…