AI 的未来是开源的

news2024/12/25 15:45:39

想象一下,在未来,人工智能不会被锁在公司的金库里,而是由全球创新者社区一砖一瓦地在开放中构建的。协作,而不是竞争,推动进步,道德考虑与原始绩效同等重要。这不是科幻小说,而是人工智能发展核心正在酝酿的开源革命。但大型科技公司有自己的议程,将受限制的模型掩盖为开源,同时试图从真正开放的社区中获益。让我们剥开代码层,揭开这些努力背后的真相。这场对开源人工智能未来的探索将剖析人工智能开发中的“伪装者”,并捍卫“真正的伪装者”,以揭示开源软件在这一切之下嗡嗡作响的创新引擎。最重要的是,开源人工智能将产生一个开源数据堆栈。

需求

Matteo Wong最近在《大西洋月刊》(The Atlantic)上发表的一篇文章《从来没有’开放’人工智能》(There There was so a Thing as ‘Open’ AI“)描述了学术界和软件界对真正开源人工智能的日益增长的趋势。“我们的想法是创建相对透明的模型,让公众可以更轻松、更便宜地使用、研究和复制,试图使高度集中的技术民主化,这种技术可能有可能改变工作、警察、休闲甚至宗教。《大西洋月刊》表明,像 Meta 这样的大型科技公司正试图通过“公开清洗”他们的产品来满足市场的这一需求。他们承担了开源社区的品质和良好的声誉,而没有真正开源他们的产品。但是,真实的东西是无可替代的。这是因为真正的开源软件推动了创新和协作:这是负责任地推进人工智能所迫切需要的两种品质。

伪装者

LLaMA 2 是由 Meta 创建的大型语言模型,可免费用于研究和商业用途。导致一些人认为 LLaMA 2 是开源的。但是,Meta 对其模型的使用实施了一些严格的限制。例如,LLaMA 2 不能用于改进任何其他大型语言模型。这一立场与开放软件的传统私人集体创新模式背道而驰,这种模式促进了自由和开放的创新揭示,以造福软件社区中的每个人。

Meta 不允许将 LLaMA 2 与每月拥有 7 亿用户的产品集成,并且不允许透露他们的模型是根据哪些数据进行训练的,或者他们用来构建模型的代码,从而进一步削弱了其模型的使用。通过不披露,Meta 正在向固有偏见和意外歧视的问题敞开大门。根据歧视性数据训练的模型将提供歧视性反应。如果整个软件社区无法查看用于构建模型的代码,以查看是否内置了任何保护措施,或者用于训练模型的数据,那么我们在这些道德问题上就一无所知。在已发表的人工智能研究更关注性能而不是正义和尊重的时代,这种混淆尤其令人不安。

真正的开源AI

Mistral AI 因其开源大型语言模型而获得认可,尤其是 Mistral 7B 和 Mixtral 8x7B。该公司努力确保其 AI 模型的广泛可访问性,鼓励开放软件社区进行审查、修改和重用。

vLLM 代表“矢量化低延迟模型服务”,是一个专门用于加速和优化大型语言模型的开源库 (LLMs)。它是一个强大的工具,可以显着提高 LLMs的性能和可用性。这使得它成为从事各种人工智能应用程序的开发人员的宝贵资产,从聊天机器人和虚拟助手到内容创建和代码生成。因此,Mistral 建议使用 vLLM 作为 7B 和 8x7B 模型的推理服务器。

EleutherAI 是一个非营利性 AI 研究实验室,已从用于讨论 GPT-3 的 Discord 服务器发展成为领先的非营利性研究组织。该小组以其在自然语言处理领域培训和推广开放科学规范的工作而闻名。他们发布了各种开源大型语言模型,并参与了与人工智能对齐和可解释性相关的研究项目。他们的 LM-Harness 项目可能是领先的语言模型开源评估工具。

Phi-2是Microsoft的,它的重量超过了LLM它的重量。这个小而强大的模型在合成文本和过滤网站的混合体上进行了训练,在问答、总结和翻译等任务方面表现出色。真正让 Phi-2 与众不同的是它专注于推理和语言理解,即使没有先进的对齐技术,也能带来令人印象深刻的性能。它在偏见和毒性领域大放异彩,显示出危害较小的人工智能交互的潜力。️

许多称职的开源嵌入模型正在加强整个开源生成式 AI 空间。这些是当前最先进的开源技术,包括 UAE-Large-V1 和多语言-e5-largel。

在这个不断发展的领域中,还有更多。这个有限的列表只是一个开始。

开源推动创新

真正参与开源软件开发的公司秉承极端开放创新的理念,通过承认并非所有好的代码或伟大的想法都存在于他们的组织中,来挑战传统的竞争优势概念。这种转变支持了这样一种观点,即开源生态系统中的共享创新会导致更快的市场增长,甚至为研发资金有限的小型软件公司提供从开源软件中存在的研发溢出效应中受益的机会。这是因为,与传统的外包相比,开放式创新通过利用社区的集体智慧来增强内部资源,而不会减少内部研发工作。这意味着,开源软件公司不必牺牲他们的预算来追求组织之外的思想领导力和代码。此外,开源软件公司通过尽早和经常发布代码来战略性地推动创新,认识到软件社区中创新过程的累积性。总而言之,许多人已经认识到:开源软件推动创新。

开放式促进协作

通过在开源软件社区中建立联系,企业家能够实现短期和长期目标。短期利润目标建立公司,长期利润目标维持公司。同时,这种网络努力使网络本身永久化 - 为下一个企业家发展它。众所周知,开源平台提供对源代码的访问,使开发人员能够创建升级、插件和其他软件,并根据他们的要求使用它们。随着更广泛的软件社区广泛采用 Kubernetes,这种特殊的协作经历了繁荣。现在,现代技术比以往任何时候都更能协同工作,摩擦非常小,几乎可以在几分钟内完成。

大型科技公司在自由发布他们创建的框架、库和语言来维护和开发内部工具时,承认了开源社区固有的这种深度合作。这样做可以加深能够开发其产品的开发人员库,并开始为类似技术的运行方式设定标准。《大西洋月刊》的同一篇文章援引Meta创始人马克·扎克伯格(Mark Zuckerberg)的话说,“对我们来说,提供这种服务非常有价值,因为现在整个行业所有最好的开发人员都在使用我们在内部使用的工具”。

开源产生开源

这些都是为什么我们经常看到开源公司之间的协同效应的因素。开源 AI 和 ML 公司自然会使用其他开源产品开发解决方案,从对象存储等基础产品到堆栈再到可视化工具。当一家开源公司向前迈进时,我们都会这样做。这种有凝聚力的混合方法可能是我们开发采用以人为本方法的人工智能的最佳选择。这些市场固有的自然力量,对开源人工智能的需求,加上开源软件的创新和协作品质,将推动人工智能数据堆栈开源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1400803.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

竞赛保研 机器视觉人体跌倒检测系统 - opencv python

0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 机器视觉人体跌倒检测系统 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数&…

如何在Servlet中获取请求参数的值

看看这个大佬做的动图吧! 在Servlet中,你可以使用HttpServletRequest对象来获取请求参数的值。HttpServletRequest对象提供了一些方法,允许你访问从客户端发送的请求信息。以下是一些获取请求参数的常用方法: getParameter(String…

伊恩·斯图尔特《改变世界的17个方程》傅里叶变换笔记

主要是课堂的补充(yysy,我觉得课堂的教育模式真有够无聊的,PPT、写作业、考试,感受不到知识的魅力。 它告诉我们什么? 空间和时间中的任何模式都可以被看作不同频率的正弦模式的叠加。 为什么重要? 频率分量…

this.$set的用法

作用: 在data里面绑定的数据具有响应式的效果,也就是我们说的V-Model 数据更新视图,视图也能更新数据,如果不是data里面的数据如何添加响应式呢? this.$Set这个方法能够实现 用法: this.$Set(要添加的对象,要添加的属性’,要添…

20240121----重返学习-`nginx/conf/nginx.conf`的动静分离-单ip地址双服务器资源-最简配置说明

20240113----重返学习-nginx/conf/nginx.conf的多虚拟主机配置最简配置说明 文件说明 单ip地址双服务器资源配置 单个完整的静态项目 192.168.44.101上的配置文件: worker_processes 1; #工作进程个数;一般对应CPU内核对应一个worker_processes;太多反而让效率变差;even…

App 设计工具中的回调

目录 创建回调函数 回调函数编程 回调输入参数 在回调函数之间共享数据 在多个组件之间共享回调 以编程方式创建和分配回调 在代码中搜索回调 更改回调或断开与回调的连接 删除回调 示例:具有滑块回调的 App 回调是在用户与 App 中的 UI 组件交互时执行的…

数据结构之树和二叉树定义

数据结构之树和二叉树定义 1、树的定义2、树的基本概念3、二叉树的定义 数据结构是程序设计的重要基础,它所讨论的内容和技术对从事软件项目的开发有重要作用。学习数据结构要达到的目标是学会从问题出发,分析和研究计算机加工的数据的特性,以…

基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖微信小程序端(十三)

地址簿相关功能 1.1 需求分析和设计1.1.1 产品原型1.1.2 接口设计1.1.3 表设计 1.2 代码实现1.2.1 Mapper层1.2.2 Service层1.2.3 Controller层 1.1 需求分析和设计 1.1.1 产品原型 地址簿,指的是消费者用户的地址信息,用户登录成功后可以维护自己的地…

a-table 边框颜色修改

案例&#xff1a; <template><div class"mod_table"><a-table :columns"columns":data-source"data" bordered:pagination"false"></a-table></div> </template> <script> export default…

sshpass的安装与使用

一.简介 1.定义&#xff1a; ssh 登陆不能在命令行中指定密码&#xff0c;sshpass 的出现则解决了这一问题。它允许你用 -p 参数指定明文密码&#xff0c;然后直接登录远程服务器&#xff0c;它支持密码从命令行、文件、环境变量中读取。 2.使用 sshpass 原因 使用 sshpass…

代码随想录 Leetcode20. 有效的括号

题目&#xff1a; 代码(首刷自解 2024年1月21日&#xff09;&#xff1a; class Solution {bool check(char ch1,char ch2) {if(ch1 ) && ch2 ! () return true;else if(ch1 ] && ch2 ! [) return true;else if(ch1 } && ch2 ! {) return true;els…

C++——数组、多维数组、简单排序、模板类vector

个人简介 &#x1f440;个人主页&#xff1a; 前端杂货铺 &#x1f64b;‍♂️学习方向&#xff1a; 主攻前端方向&#xff0c;正逐渐往全干发展 &#x1f4c3;个人状态&#xff1a; 研发工程师&#xff0c;现效力于中国工业软件事业 &#x1f680;人生格言&#xff1a; 积跬步…

FaFu--练习复盘--2

3、函数练习 3.1、函数表达式&#xff08;1&#xff09; 描述 根据以下公式计算数学表达式的值&#xff0c;并将结果作为函数值返回。在main()函数中输入x&#xff0c;调用函数fun(x)&#xff0c;并输出fun(x)的值。 输入 输入1行&#xff0c;包含1个double类型的浮点数&…

数学建模实战Matlab绘图

二维曲线、散点图 绘图命令&#xff1a;plot(x,y,’line specifiers’,’PropertyName’,PropertyValue) 例子&#xff1a;绘图表示年收入与年份的关系 ‘--r*’:--设置线型&#xff1b;r:设置颜色为红色&#xff1b;*节点型号 ‘linewidth’&#xff1a;设置线宽&#xff1…

基于springboot+vue考编论坛

摘要 近年来&#xff0c;随着互联网的迅猛发展&#xff0c;编程论坛成为程序员们交流学术、分享经验的重要平台之一。为了满足广大程序员的需求&#xff0c;本文基于Spring Boot和Vue框架&#xff0c;设计并实现了一个功能强大的编程论坛。首先&#xff0c;我们选择Spring Boot…

RHEL - 更新升级软件或系统

《OpenShift / RHEL / DevSecOps 汇总目录》 文章目录 小版本软件更新yum update 和 yum upgrade 的区别升级软件和升级系统检查软件包是否可升级指定升级软件使用的发行版本方法1方法2方法3方法4 查看软件升级类型更新升级指定的 RHSA/RHBA/RHEA更新升级指定的 CVE更新升级指定…

当 OpenTelemetry 遇上阿里云 Prometheus

作者&#xff1a;逸陵 背景 在云原生可观测蓬勃发展的当下&#xff0c;想必大家对 OpenTelemetry & Prometheus 并不是太陌生。OpenTelemetry 是 CNCF&#xff08;Cloud Native Computing Foundation&#xff09;旗下的开源项目&#xff0c;它的目标是在云原生时代成为应…

Softmax函数介绍

Softmax函数是一种常用的激活函数&#xff0c;用于将一组实数值转换为概率分布。它常用于多类别分类问题中&#xff0c;将输入向量映射为各个类别的概率。 Softmax函数的公式如下&#xff1a; 其中&#xff0c;示输入向量的第 &#xfffd;i 个元素&#xff0c;&#xfffd;n …

【目标检测】YOLOv5算法实现(九):模型预测

本系列文章记录本人硕士阶段YOLO系列目标检测算法自学及其代码实现的过程。其中算法具体实现借鉴于ultralytics YOLO源码Github&#xff0c;删减了源码中部分内容&#xff0c;满足个人科研需求。   本系列文章主要以YOLOv5为例完成算法的实现&#xff0c;后续修改、增加相关模…

RHCE上课笔记(前半部分)

第一部分 网络服务 第一章 例行性工作 1.单一执行的例行性工作 单一执行的例行性工作&#xff08;就像某一个时间点 的闹钟&#xff09;&#xff1a;仅处理执行一次 1.1 at命令&#xff1a;定时任务信息 [rhellocalhost ~]$ rpm -qa |grep -w at at-spi2-core-2.40.3-1.el9.x…