最新资讯 | 开源大模型Llama会失去技术优势吗?

news2024/11/11 23:07:57

昨夜,Meta宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,支持上下文长度为128K Tokens,在基于15万亿个Tokens、超1.6万个H100 GPU上进行训练,这也是Meta有史以来第一次以这种规模训练Llama模型。Meta同时还发布了全新升级的Llama 3.1 70B和8B模型。Llama 3.1 405B研究人员基于超150个基准测试集的评测结果显示,Llama 3.1 405B可与GPT-4o、Claude 3.5 Sonnet和Gemini Ultra等头部模型媲美。

Meta公司CEO马克·扎克伯格撰写长文,除宣布发布 Llama 3.1 模型外,还阐述开源 AI 的重要性。他表示,这些模型具有高性能、开放性和可定制性,并得到广泛生态系统的支持。“我们发布了Llama 3.1 405B,这是第一个前沿级别的开源人工智能模型。除了与闭源模型相比具有显著更好的性能比之外,405B模型的开放性将使其成为微调和蒸馏更小模型的最佳选择。”

开源AI将成为行业主流

扎克伯格以Linux操作系统取代闭源Unix为例,提出开源AI将凭借开放性、可修改性和成本效益优势,超越闭源模型,成为行业主流的观点。“当你考虑未来的机遇时,请记住,当今大多数领先的科技公司和科学研究都是建立在开源软件之上的。如果我们共同投资,下一代公司和研究将使用开源人工智能”。

扎克伯格提到,与世界各地的开发者、首席执行官和官员交谈时,通常会听到几个观点。

第一,用户需要训练、微调和蒸馏自己的模型。每个用户用对模型的规模都有其独特的需求,期望这些模型可以根据其特定的数据进行训练或微调。对于设备上的任务和分类任务,小模型足矣;而对于更加复杂的任务,则需要大模型。“现在,你可以利用最先进的Llama模型,用你自己的数据继续训练它们,然后将它们蒸馏成一个最适合你需要的模型尺寸——而无需让我们或任何其他人看到你的数据”。扎克伯格说。

第二,用户需要控制自己的命运,不想被闭源模型供应商限制。许多用户不希望依赖其无法自行运行和控制的模型。他们不希望闭源模型提供者能够更改模型、修改使用条款,甚至完全停止服务。用户也不想被限制在只有一个云平台拥有模型独家使用权。“开源允许广泛的公司生态系统拥有兼容的工具链,使你可以轻松地在它们之间迁移”。

第三,用户需要保护自己的数据安全。许多用户处理敏感数据时需要加以保护,不能通过闭源模型的云API发送。还有一些用户根本不信任闭源模型提供者处理他们的数据。“开源通过允许你在任何地方运行模型来解决这些问题。普遍认为,开源软件通常更安全,因为它的开发过程更加透明”。

第四,用户需要运行效率高且能负担得起使用成本的模型。“开发者可以在自己的基础设施上,以大约使用闭源模型如GPT-4o一半的成本,运行Llama 3.1 405B的推理,无论是面向用户的还是离线推理任务”。

第五,用户希望投资能够成为长期标准的生态系统。许多用户看到开源的发展速度比闭源模型快,希望自己的系统能建立在能给他们带来最大长期优势的架构上。

扎克伯格认为开源AI的具有诸多优势。对开发者而言,可自定义模型、控制数据安全、降低成本、构建长期生态系统;从Meta的角度来看,可以避免技术锁定、促进创新、建立开源生态;从大模型发展的角度来看,可以推动技术进步,因开源模型更透明,可广泛审查,有助于提高安全性。

扎克伯格表示,开源AI 代表着利用这项技术为每个人创造最大经济机会和安全的最佳机会,并呼吁更多人加入开源 AI 的旅程。“我相信开源对于推动人工智能未来积极发展至关重要。人工智能比任何其他现代技术都有更大的潜力来提升人类的生产力、创造力和生活质量——并加速推动经济增长,同时推动医学和科学研究的进步。开源将确保全球更多的人能够享受人工智能带来的好处和机会,权力不会集中在少数公司手中,技术可以更均匀、更安全地在社会中部署”。

Meta 承诺构建更广泛的生态系统 使Llama成为行业标准

Meta承诺将继续推动开源 AI 的发展,与社区和合作伙伴合作,构建更广泛的生态系统。

除了发布这些模型外,扎克伯格表示Meta正与一系列公司合作,以发展更广泛的生态系统。亚马逊、Databricks和英伟达正在推出一整套服务,支持开发者微调和蒸馏自己的模型。像Groq这样的创新者已经为所有新模型构建了低延迟、低成本的推理服务。这些模型将在所有主要云平台上提供,包括AWS、Azure、Google、Oracle等。像Scale.AI、Dell、德勤等公司已准备好帮助企业采用Llama,并用他们自己的数据训练定制模型。“随着社区的增长和更多公司开发新服务,我们可以共同使Llama成为行业标准,将AI的好处带给每个人”。

Meta为什么要致力于开源人工智能?开源Llama会失去技术优势吗?“我认为开源是最好的开发堆栈,是一个长期可持续的平台。”扎克伯格说。首先,为了确保Llama能够获取最佳技术,并且长期不会被锁定在闭源生态系统中,Llama需要发展成为一个完整的工具生态系统,包括效率提升、硅片优化和其他集成。“如果我们是唯一使用Llama的公司,这个生态系统就不会发展起来,我们的表现也不会比Unix的闭源版本更好”。

其次,人工智能非常具有竞争力,这意味着开源任何特定模型并不会在当时具有比下一个最佳模型更大的优势。“Llama成为行业标准的道路是通过持续保持竞争力、效率和开放性,一代又一代地发展”。

再次,Meta与闭源模型提供者的一个关键区别在于,出售对人工智能模型的访问并不是Llama的商业模式。“这意味着公开发布Llama并不会削弱我们的收入、可持续性或研究投资能力,而这对于闭源提供者来说则不然”。

最后,Meta有着长期的开源项目和成功的历史。“我们通过发布服务器、网络和数据中心设计,并让供应链标准化设计,通过Open Compute项目节省了数十亿美元。我们通过开源诸如PyTorch、React等领先工具,从生态系统的创新中受益。长期坚持这种方法对我们始终有效”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1982456.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年,pdf文献热门翻译软件总结推荐

对于如今的时代,市面上存在各式各样的学术资料,对于没有语言天赋的我,看得眼花缭乱。看个学术资料都不知道要用哪个工具,试来试去和睦浪费时间。今天就我使用过的翻译软件中,整理了四款能帮助我们解决文献翻译难题的四…

未授权访问漏洞系列详解⑧!

Druid未授权访问漏洞 漏洞特征:http://www.xxxx.com/druid/index.html 当开发者配置不当时就可能造成未授权访问下面给出常见Druid未授权访问路径 ------------- /druid/websession.html /system/druid/websession.html /webpage/system/druid/websession.html(jeecg) ----…

GitHub惊天安全漏洞:删除的仓库竟能永远访问

引言 近日,GitHub 被曝出一个严重的安全漏洞,引发了广泛关注。开源安全软件公司 Truffle Security 的安全研究员 Joe Leon 发现,在 GitHub 上删除的代码仓库实际上仍然可以被访问。这一发现震惊了整个开源社区。本文将详细探讨这一安全漏洞的…

PXE服务器自助部署

kickstart部分 一、实验环境 两台主机:一台用于环境搭建(ngnix.yee.org),一台用于测试(check_ks)。测试机 二、开启主机图形工具,并进行基本配置 查看 /root/anaconda-ks.cfg 文件,这个文件是系统安装以…

学习记录——day26 进程间的通信(IPC)无名管道 无名管道 信号通信 特殊的信号处理

目录 一、进程间通信引入 二、无名管道 1、无名管道相关概念 2、无名管道的API接口函数 pipe(int pipefd[2]); 3、管道通信的特点 4、管道的读写特点 三、无名管道 1、有名管道:有名字的管道文件,其他进程可以调用 2、可以用于亲缘进程间的通信&…

windows下,使用vs code远程连接云服务器【以CentOS7为例】

windows下,使用vs code远程连接云服务器 1. 下载VS code并准备相关插件2. 使用Remote - SSH远程控制Linux 1. 下载VS code并准备相关插件 1. VS code官网: 下载地址:https://code.visualstudio.com/Download下载合适版本的vs code。 2. 推荐…

20款奔驰S450升级原厂红外夜视系统,提升您夜晚行车安全

夜视辅助系统增强版不仅可以对处于潜在危险位置的行人进行探测,还可发现动物。当车辆进入没有路灯的区域,第三代夜视系统可自动将仪表盘的显示内容从车速表转变为锐度极高的夜视图像,并将探测到前方出现的行人或动物在系统中以鲜明的色彩突出…

CSS前端:元素的布局技巧

【备注】在线测试网站&#xff0c;点此进入。 一、内边距和外边距 【总结】padding增加本元素和子元素的距离&#xff0c;margin增加本元素和父元素的距离。 二、居中和对齐 【需求】 【HTML】 <div id"container"><p id"top">我在div容器…

打卡第33天------动态规划

周末的时候刷题了,在代码随想录系统的学习了一遍算法,看到leetcode上的题不再那么懵了,有点思路了,心里面对题的恐惧感也在逐渐消失,滴水石穿,小坚持带来大改变。 一、不同路径 leetcode题目链接:62.不同路径 题目描述: 一个机器人位于一个 m x n 网格的左上角 (起始…

【更新2022】省级经济高质量发展指标体系测度 含代码 2000-2022

重磅更新&#xff01;【章汕】制作“省级经济高质量发展指标体系测度 含代码”&#xff0c;市面上有这个版本的数据&#xff0c;但其内容非常不全面&#xff0c;个别指标有误&#xff0c;没有stata和代码&#xff0c;即使有代码小白也很容易报错&#xff1b;没有权重、宽面板等…

大数据SQL面试题002-合并日期重叠的活动

在大数据SQL面试中&#xff0c;我们经常会遇到一些棘手的问题&#xff0c;比如合并日期重叠的活动。本文将为大家详细解析这个问题&#xff0c;并提供相应的解决方案。 一、题目分析 题目要求我们处理一个表&#xff0c;表中记录了每个品牌的活动开始日期和结束日期。如果两个…

鸿蒙(API 12 Beta2版)NDK开发【LLDB高性能调试器】调试和性能分析

概述 LLDB&#xff08;Low Level Debugger&#xff09;是新一代高性能调试器。 当前HarmonyOS中的LLDB工具是在[llvm15.0.4]基础上适配演进出来的工具&#xff0c;是HUAWEI DevEco Studio工具中默认的调试器&#xff0c;支持调试C和C应用。 工具获取 可通过HUAWEI DevEco S…

c语言-EasyX库编写的第一个项目-哪都通快递平台

目录 概要设计与详细设计文档 项目测试 相关文件下载 作为《程序设计微项目设计》进行为期一周的开发 概要设计与详细设计文档 1&#xff0e; 项目名称 “哪都通”快递平台 2.项目概述 2.1项目简介 本项目采用c语言全程编写&#xff0c;运用Easyx库创建窗口进行图形显…

shell函数的基本知识

文章目录 shell函数定义函数调用函数函数参数返回值 Shell 输入/输出重定向输入重定向输出重定向 Shell 函数是 Shell 脚本编程中的一个非常有用的特性&#xff0c;它允许你将一段代码封装起来&#xff0c;给它一个名字&#xff08;函数名&#xff09;&#xff0c;然后在脚本的…

力扣面试经典算法150题:合并两个有序数组

算法 本篇开始&#xff0c;正式进入算法刷题篇。 题目来源于力扣面试经典150题。 题目链接&#xff1a;https://leetcode.cn/studyplan/top-interview-150/ 合并两个有序数组 题目选自150题中的数组/字符串一类&#xff0c;题目难度&#xff1a;简单。 题目描述 给定两个按…

R 语言学习教程,从入门到精通,R 基础运算(5)

1、R 基础运算 本章介绍 R 语言的简单运算。 1.1、赋值 一般语言的赋值是 号&#xff0c;但是 R 语言是数学语言&#xff0c;所以赋值符号与我们数学书上的伪代码很相似&#xff0c;是一个左箭头 <- &#xff1a; a <- 123 b <- 456 print(a b)以上代码执行结果…

分享一个基于Node.js和Vue的农产品销售与交流平台(源码、调试、LW、开题、PPT)

&#x1f495;&#x1f495;作者&#xff1a;计算机源码社 &#x1f495;&#x1f495;个人简介&#xff1a;本人 八年开发经验&#xff0c;擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等&#xff0c;大家有这一块的问题可以一起交流&…

RabbitMQ-安装篇(阿里云主机)

一、操作系统 用的是Alibaba Cloud Linux release 3 (Soaring Falcon)系统&#xff0c;可以通过命令&#xff1a;lsb_release -a 查看系统信息。 二、安装RabbitMQ RabbitMQ 是基于 Erlang 语言构建的&#xff0c;要安装RabbitMQ&#xff0c;需先安装Erlang环境。通过Erlang V…

【IO】使用有名管道实现,一个进程用于给另一个进程发消息,另一个进程收到消息后,展示到终端上,并且将消息保存到文件上一份

目录 1、使用有名管道实现&#xff0c;一个进程用于给另一个进程发消息&#xff0c;另一个进程收到消息后&#xff0c;展示到终端上&#xff0c;并且将消息保存到文件上一份 2、使用有名管道实现两个进程间相互通信 1、使用有名管道实现&#xff0c;一个进程用于给另一个进程发…

Linux权限-普通权限

作者介绍&#xff1a;简历上没有一个精通的运维工程师。希望大家多多关注我&#xff0c;我尽量把自己会的都分享给大家&#xff0c;下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 根据前面Linux用户介绍&#xff0c;里面涉及到超级管理员&#xff0c;普通用户&…