Meta牵手Microsoft推出下一代Llama 2

news2024/11/28 6:28:21

官方消息

1、今天,我们将介绍 Llama 2 的可用性,这是我们的下一代开源大型语言模型。

2、Llama 2免费用于研究和商业用途。

3、Microsoft和 Meta 正在扩大他们的长期合作伙伴关系,Microsoft 是 Llama 2 的首选合作伙伴。

4、在技术、学术界和政策领域的众多公司和人士的支持下,我们将开放对 Llama 2 的访问,他们也相信当今人工智能技术的开放式创新方法。

5、我们致力于负责任地进行构建,并提供资源来帮助那些使用Llama 2的人也这样做。

在这里插入图片描述
人工智能,特别是生成人工智能的最新突破,抓住了公众的想象力,并展示了开发这些技术的人早就知道的东西——它们有可能帮助人们做不可思议的事情,创造一个经济和社会机会的新时代,并为个人、创作者和企业提供表达自己和与人联系的新方式。

我们相信,开放的方法对于当今人工智能模型的开发是正确的选择,尤其是在技术快速发展的生成空间中。通过公开提供人工智能模型,它们可以使每个人都受益。让企业、初创公司、企业家和研究人员能够获得以难以构建自己的规模开发的工具,并以他们可能无法获得的计算能力为后盾,这将为他们开辟一个充满机会的世界,让他们进行实验,以令人兴奋的方式进行创新,并最终从经济和社会中受益。

我们相信它更安全。开放对当今人工智能模型的访问意味着一代开发人员和研究人员可以作为一个社区对它们进行压力测试,快速识别和解决问题。通过了解其他人如何使用这些工具,我们自己的团队可以从中学习,改进这些工具并修复漏洞。

十多年来,Meta 一直将探索性研究、开源以及与学术和行业合作伙伴的合作作为我们人工智能工作的核心。我们亲眼目睹了开放创新如何带来惠及更多人的技术。数十种大型语言模型已经发布,并正在推动开发人员和研究人员的进步。它们正被企业用作新的生成式人工智能体验的核心成分。研究人员对Llama 1的巨大需求让我们感到震惊 - 有超过100,000个访问大型语言模型的请求 - 以及他们通过构建它所取得的惊人成就。

我们现在已准备好开源下一个版本的Llama 2,并 免费提供用于研究和商业用途。我们还包括预训练模型和对话微调版本的模型权重和起始代码。正如萨蒂亚·纳德拉(Satya Nadella)在Microsoft Inspire的舞台上宣布的那样,我们正在将我们的合作伙伴关系提升到一个新的水平,Microsoft是我们Llama 2的首选合作伙伴,并扩大我们在生成AI方面的努力。 从今天开始,Llama 2 将在 Azure AI 模型目录中提供,使使用 Azure Microsoft开发人员能够使用它进行构建,并利用其云原生工具进行内容筛选和安全功能。它还经过优化,可在 Windows 上本地运行,为开发人员提供无缝的工作流程,因为他们为不同平台上的客户带来了生成 AI 体验。Llama 2也可以通过Amazon Web Services(AWS),Hugging Face和其他提供商获得。

人们和企业都从 Microsoft 和 Meta 之间的长期合作关系中受益。我们共同为可互换的 AI 框架引入了一个开放的生态系统,并共同撰写了研究论文,以推进 AI 的最新技术。我们已经合作扩大了 PyTorch(由 Meta 和 AI 社区创建的当今领先的 AI 框架)在 Azure 上的采用,我们是 PyTorch 基金会的创始成员之一。Microsoft和 Meta 最近加入了一群支持者,他们支持人工智能伙伴关系在创建和共享合成媒体方面的集体行动框架。我们的合作伙伴关系也延伸到人工智能之外,也延伸到元宇宙, 为未来的工作和娱乐提供身临其境的体验。

现在,通过这种扩大的合作伙伴关系,Microsoft 和 Meta 正在支持一种开放的方法,以提供更多的基础 AI 技术,从而为全球企业带来好处。不仅仅是 Meta 和 Microsoft 相信民主化对当今 AI 模型的访问。我们在世界各地也有广泛的不同支持者,他们也相信这种方法——包括向我们提供早期反馈并很高兴使用 Llama 2 构建新产品的公司、将 Llama 2 纳入其为客户提供的产品中的云提供商、与我们合作安全、负责任地部署大型生成模型的研究机构, 以及技术、学术界和政策领域的人们,他们和我们一样看到了好处。

责任

我们的开源方法可提高透明度和可访问性。我们知道,虽然人工智能为社会带来了巨大的进步,但它也带来了风险。我们致力于负责任地进行建设,并提供许多资源来帮助那些使用Llama 2的人也这样做。

**红队练习:**我们经过微调的模型已经过红队 - 通过内部和外部努力进行安全性测试。该团队致力于生成对抗性提示,以促进模型微调。此外,我们委托第三方对我们微调的模型进行外部对抗性测试,以同样地识别性能差距。这些安全微调过程是迭代的;我们将继续通过微调和基准测试来投资安全性,并计划在这些努力的基础上发布更新的微调模型。

**透明度原理图:**我们解释了模型的微调和评估方法,并确定了其缺点。我们的透明度示意图位于研究论文中,披露了我们遇到的已知挑战和问题,并提供了对所采取的缓解措施和我们打算探索的未来缓解措施的见解。

**负责任使用指南:**我们创建了本指南作为资源,以支持开发人员提供负责任开发和安全评估的最佳实践。它概述了反映整个行业和人工智能研究界讨论的关于负责任的生成人工智能的当前最先进的研究的最佳实践。

**可接受使用政策:**我们制定了 禁止某些用例的政策,以帮助确保公平、负责任地使用这些模型。

Meta 还制定了新的计划,以利用全球个人、研究人员和开发人员的洞察力和创造力,获取有关模型性能以及如何改进模型的反馈。

**开放式创新人工智能研究社区:**今天,我们还为学术研究人员启动了一项新的合作伙伴计划,旨在加深我们对负责任地开发和共享大型语言模型的理解。研究人员可以申请加入从业者社区,分享有关这一重要主题的学习成果,社区将形成一个研究议程以继续前进。

**Llama 影响力挑战:**我们希望激活渴望使用Llama解决难题的创新者社区。我们正在发起一项挑战,以鼓励各种公共、非营利和营利性实体使用 Llama 2 来应对环境、教育和其他重要挑战。挑战规则将在开始之前提供。

结论

纵观我们公司的历史,我们在业务的其他领域进行创新时体验到了开源方法的好处。我们的工程师开发并共享了现在已成为行业标准的框架,例如 React,它是制作 Web 和移动应用程序的领先框架,以及 PyTorch,现在是 AI 的领先框架。这些成为整个技术行业的常用基础设施。我们相信,公开共享当今的大型语言模型也将支持有用且更安全的生成AI的开发。

我们期待看到世界在《Llama 2》中构建的东西。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/777859.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[SQL系列] 从头开始学PostgreSQL 自增 权限和时间

[SQL系列] 从头开始学PostgreSQL 事务 锁 子查询_Edward.W的博客-CSDN博客https://blog.csdn.net/u013379032/article/details/131841058上一篇介绍了事务,锁,子查询 事务有点像是原子操作,需要有完整性,要么全都完成了&#xff…

【目标跟踪】2、FairMOT | 平衡多目标跟踪中的目标检测和 Re-ID 任务 | IJCV2021

文章目录 一、背景二、方法2.1 Backbone2.2 检测分支2.3 Re-ID 分支2.4 训练 FairMOT2.5 Online Inference 三、效果3.1 数据集3.2 实现细节3.3 消融实验3.4 最终效果 论文:FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracki…

基于大模型的Text2SQL微调的实战教程

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

(转载)基于 BP_Adaboost 的强分类器设计(matlab实现)

本博客的完整代码获取: https://www.mathworks.com/academia/books/book106283.html 1案例背景 1.1 BP_Adaboost模型 Adaboost算法的思想是合并多个“弱”分类器的输出以产生有效分类。其主要步骤为:首先给出弱学习算法和样本空间(x,y),从样本空间中找出m组训练数…

Postman传递对象参数(包含有集合对象)

postman通常需要传递各式各样的参数,本文主要介绍了Postman传递对象参数(包含有集合对象),具有一定的参考价值,感兴趣的小伙伴们可以参考一下 项目场景: postman通常需要传递各式各样的参数,这样的话,进行…

自然语言处理与词嵌入

1、词表特征 前面介绍过表征单词的方式是首先建立一个较大的词汇表(例如10000),然后使用one-hot的方式对每个单词进行编码。例如单词Man,Woman,King,Queen,Apple,Orange分别出现在词…

Docker数据管理和网络通信 dockerfile

Docker数据管理和网络通信 dockerfile 一:Docker 的数据管理1.数据卷2.数据卷容器 二:端口映射三:容器互联(使用centos镜像)四:Docker 镜像的创建1.基于现有镜像创建2&am…

C++入门先填坑

C是在C的基础之上,容纳进去了面向对象编程思想,并增加了许多有用的库,以及编程范式等。熟悉C语言之后,对C学习也有一定的帮助。 C入门先填坑系列主要内容会围绕以下方面 补充C语言语法的不足,以及C是如何对C语言设计不…

servlet Filter与spring的OncePerRequestFilter

servlet 规范 javax.servlet Filter 任何的servlet容器都要实现的,例如tomcat、undertow、jetty等等。类似于jdbc规范,制定好了一个约束,各家数据库厂商根据规范开发对应的驱动来实现访问自己的数据库。 spring 对于Filter的自定义实现 所…

NLP(六十)Baichuan-13B-Chat模型使用体验

2023年7月11日,百川智能正式发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。   本文将介绍大模型BaiChuan-13B-Chat的使用体验,其HuggingFace网址为:https://huggingface.co/bai…

【C语言day02】

转义字符 \\ 表示字符\,\123表示字符{,\t表示制表符,这些都是一个字符宏只是替换 替换后NUM的样子是(211)*21/2常量指针与指针常量 const和* 来区别,如果是const * 这样的顺序就是常量指针,所以说他的本质是指针&am…

uni-app:请求后端数据uni.request

完整代码: onLoad() {uni.request({url: getApp().globalData.position Produce/select_employee,data: {username: getApp().globalData.username,},method: POST,dataType: json,success: res > {this.employee_name res.data.info.employee_name;// consol…

uniapp 之 微信小程序、支付宝小程序 对于自定义导航栏的不同

目录 前言 微信小程序 代码 支付宝小程序 首页配置文件 二级菜单页面 配置 总结 不同 相同 前言 小程序都是 uni-app 写的 不是原生 微信小程序 代码 pages.json文件中配置 重点: "navigationStyle": "custom", // 导航栏样式…

安卓开发日记问题记录(隐藏标题栏中的应用名称)

当我们设置了显示标题栏,应用名也会显示出来,这对设置标题栏内容很不方便 可以在activity里的onCreate部分设置这句代码隐藏APP名字 getSupportActionBar().setDisplayShowTitleEnabled(false);或者改变它 getSupportActionBar().setTitle("new …

疲劳驾驶检测和识别1: 疲劳驾驶检测和识别数据集(含下载链接)

疲劳驾驶检测和识别1: 疲劳驾驶检测和识别数据集(含下载链接) 目录 疲劳驾驶检测和识别1: 疲劳驾驶检测和识别数据集(含下载链接) 1. 前言 2. 疲劳驾驶类别说明 3. 疲劳驾驶检测数据集: (1)Drowsy-Driving-Det1 …

hadoop安全保护机制(kerberos + ldap)

信息安全理论: CIA模型:机密性、完整性和可用性 CIA模型能够帮助建议一些信息安全原则,但该模型并不是一个需要严格遵守的规则 hadoop平台可能设计多个CIA模型组件,也kennel一个也不涉及 机密性: 信息只应该被期望的…

高压放大器的增益和偏压是什么意思

高压放大器是一种广泛应用的电子元器件,主要用于放大高压信号和驱动负载等方面。在实际应用中,了解高压放大器的增益和偏压是非常重要的,下面安泰电子将详细介绍它们的意义和作用。 高压放大器的增益 增益是指放大器输入信号与输出信号之间的…

iClient3D for CesiumWebGL入门之使用vscode以服务方式运行调试

作者:超图研究院技术支持中心-于丁 iClient3D for Cesium&WebGL入门之使用vscode以服务方式运行调试 相信大家第一次使用SuperMap iClient3D for Cesium或SuperMap iClient3D for WebGL的时候,都遇到过和我一样的事情: 在文件夹中直接打…

二极管钳位电路的原理与实际应用

写在前面 本文参考了什么是二极管钳位的作用及原理? - 知乎 针对一些文章讲述错误的地方进行了更正,在讲述不清楚的地方进行了详细的解释,还请各位两篇文章结合而看,效果更佳。 钳位电路说明 1.我们都知道二极管具有单向导电性&a…

【Ajax】笔记-Ajax重复发送请求

问题的产生 用户频繁地点击一个发送请求的按钮,服务器就会频繁地处理请求,而且处理的内容是一样的,这样会导致服务器的压力很大。 这种情况下服务器就没有必要处理每一个请求。 解决方案 发送请求的时候先查看有没有正在请求的相同请求&am…