[240724] Meta 发布全新大语言模型 Llama 3.1 | Apple 开源全新 AI 模型,打造高效 AI 生态

news2024/12/27 9:48:57

目录

    • Meta 发布全新发语言模型 Llama 3.1
    • Apple 开源全新 AI 模型,挑战 Meta,打造高效 AI 生态

Meta 发布全新发语言模型 Llama 3.1

Llama 3.1 提供 8B、70B 和 405B 三种参数规模,其中 405B 版本在通用知识、可控性、数学、工具使用和多语 言翻译方面均达到业界领先水平。

升级后的 8B 和 70B 模型支持多语言,上下文长度扩展至 128K,具备先进的工具使用能力和更强的推理能力,可用于长文本摘要、多语言对话代理和编码助手等场景。

Meta 还更新了许可协议,允许开发者使用 Llama 模型(包括 405B 版本)的输出改进其他模型。

Llama 3.1 的主要优势:

  • 三种参数规模,满足不同需求
  • 405B 版本性能媲美 GPT-4 等顶级模型
  • 升级后的 8B 和 70B 模型支持多语言和更长上下文
  • 具备先进的工具使用能力和更强的推理能力
  • 许可协议更加开放

Llama 3.1 的应用场景:

  • 长文本摘要
  • 多语言对话代理
  • 编码助手

模型评估:

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Meta 通过 150 多个基准数据集和大量人工评估,验证了 Llama 3.1 的性能优势。实验结果表明,Llama 3.1 在 各种任务上均具有竞争力,其旗舰模型可与 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 等领先基础模型相媲美。

终端用户可通过命令行方式获取相关模型:

# 安装 ollama
x ollama install

# 运行 Llama3.1 模型
x ollama run llama3.1:latest

# 查看本地已下载的模型
x ollama ls

使用案例:

在这里插入图片描述

来源:

https://ollama.com/library/llama3.1

Apple 开源全新 AI 模型,挑战 Meta,打造高效 AI 生态

苹果公司最近开源了其最新的70亿参数人工智能模型 DCLM,加入开源AI运动并挑战 Meta 等巨头。

这款模型虽然规模不大,但性能优异,在基准测试中表现超越 Meta 的 Mistral-7B,并接近谷歌同等规模模型。更重要的是,DCLM 模型的权重、训练代码和数据集全部开源,任何人都可以使用或改编,这与 Meta 即将发布的4000亿参数 Llama 3 形成鲜明对比。

苹果开发 DCLM 模型的目标是创建一个高效且高质量的数据集,并通过开源方式推动更广泛的 AI 生态系统建设。该模型训练使用的内容标记更少,但效率更高,性能与同等规模的其他模型相当。

苹果此举意义重大,它不仅为研究人员和公司提供了创建小型 AI 的机会,也为构建更加开放和透明的 AI 未来迈出了重要一步。正如 OpenAI 首席执行官萨姆·奥尔特曼所说,目标是创造出便宜到可以计量的智能,而苹果的开源模型正是这一理念的体现。

终端用户可通过命令行方式获取相关模型:

# 设置在全局环境中使用 huggingface-cli
x env use huggingface

# 从 HuggingFace Hub 下载 apple/DCLM-7B 模型
huggingface-cli download apple/DCLM-7B

# 扫描缓存目录,查看模型的相关信息
huggingface-cli scan-cache

使用案例:
在这里插入图片描述

来源:

  • https://www.tomsguide.com/ai/apple-takes-on-meta-with-new-open-source-ai-model-heres-why-it-matters

  • https://huggingface.co/collections/apple/dclm-66960ebf2400d314ff19018f

更多内容请查阅 : blog-240724


关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1945328.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python鲁汶意外莱顿复杂图拓扑分解算法

🎯要点 🎯算法池化和最佳分区搜索:🖊网格搜索 | 🖊发现算法池 | 🖊返回指定图的最佳划分 | 🖊返回指定图的最佳分区 | 🎯适应度和聚类比较功能:🖊图的划分 |…

django电商用户消费数据分析系统-计算机毕业设计源码20891

摘 要 随着电子商务的快速发展,电商平台积累了大量的用户消费数据。为了更好地理解用户行为、优化商品结构和提升用户体验,本文设计并实现了一个基于Django框架的电商用户消费数据分析系统。 该系统包含后台首页、系统用户(管理员&#xf…

探索 GPT-4o mini:成本效益与创新的双重驱动

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

elk日志索引被锁blocks,日志无法写入

现象: kafka积压,logstash无法将日志写入到es logstash报错: [logstash.outputs.elasticsearch][main][] Retrying failed action {:status>403 :error>{“type”>“cluster_block_exception”, “reason”>“index [] blocked …

“微软蓝屏”全球宕机,敲响基础软件自主可控警钟

上周五,“微软蓝屏”“感谢微软 喜提假期”等词条冲上热搜,全球百万打工人受此影响,共同见证这一历史性事件。据微软方面发布消息称,旗下Microsoft 365系列服务出现访问中断。随后在全球范围内,包括企业、政府、个人在…

Spring Boot集成starrocks快速入门Demo

1.什么是starrocks? StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。 Star…

矩阵分析——线性积分方程组的矩阵解法研究

矩阵分析——线性积分方程组的矩阵解法研究 前言线性积分方程组的矩阵解法研究 前言 “矩阵分析”是一门选修课,当时选这门课程的原因是想着图像处理就涉及到很多矩阵运算。但没想到的是这门课程吧虽然是选修,最后的结课要求是让我们写一篇“论文”&…

第19讲EtherNet/IP网络基础

EtherNet/IP网络知识 一、EtherNet/IP概述 二、EtherNet/IP网络的定位 1、最上层-信息层:主要进行上位机网络信号交互或者控制层信号的传递。 比较常见的话是工控机或者说PLC,就像大脑对信息进行发送的这样一个控制。 EtherNet/IP网络属于最高层——信息层,主要负责信号的…

vue3中父子组件通讯

在子组件HelloWorld.vue中&#xff1a; <template><div class"hello">111111</div></template><script lang"ts"> import { Options, Vue } from vue-class-component;Options({props: {msg: String} }) export default cl…

多路复用IO、TCP并发模型

时分复用 CPU单核在同一时刻只能做一件事情&#xff0c;一种解决办法是对CPU进行时分复用(多个事件流将CPU切割成多个时间片&#xff0c;不同事件流的时间片交替进行)。在计算机系统中&#xff0c;我们用线程或者进程来表示一条执行流&#xff0c;通过不同的线程或进程在操作系…

群辉NAS利用AList搭建混合云盘①套件安装及百度云盘挂载

目录 一、群辉NAS准备 二、远程访问 三、安装套件 四、挂载公有云盘 1、挂载百度网盘 ……(未完待续) 公有云盘是由云服务提供商运营,向广大用户提供数据存储和文件共享服务的一种在线存储解决方案。 其优点包括: 1. 方便易用:用户可以通过互联网随时随地访问自己存…

Java企业微信服务商代开发获取AccessToken示例

这里主要针对的是企业微信服务商代开发模式 文档地址 可以看到里面大致有三种token&#xff0c;一个是服务商的token&#xff0c;一个是企业授权token&#xff0c;还有一个是应用的token 这里面主要有下面几个参数 首先是服务商的 corpid 和 provider_secret &#xff0c;这个可…

等保定级指南(PPT原件)

新版网络安全等级保护定级指南网络安全等级保护工作的作用对象&#xff0c;主要包括基础信息网络、工业控制系统、云计算平台、物联网、使用移动互联技术的网络和大数据等。 软件全套精华资料包清单部分文件列表&#xff1a; 工作安排任务书&#xff0c;可行性分析报告&#xf…

前端自动化测试(一):揭秘自动化测试秘诀

目录 [TOC](目录)前言自动化测试 VS 手动测试测试分类何为单元测试单元测试的优缺点优点缺点 测试案例测试代码 测试函数的封装实现 expect 方法实现 test 函数结语 正文开始 &#xff0c; 如果觉得文章对您有帮助&#xff0c;请帮我三连订阅&#xff0c;谢谢&#x1f496;&…

7月投稿警惕!6本On Hold期刊被数据库剔除!

本周投稿推荐 SCI&EI • 1区计算机类&#xff0c;3.5-4.0&#xff08;1个月录用&#xff09; • CCF推荐&#xff0c;1区-Top&#xff08;3天初审&#xff09; EI • 各领域沾边均可&#xff08;2天录用&#xff09; 知网&#xff08;CNKI&#xff09;、谷歌学术 •…

nginx的配置和使用

一、nginx支持win和linux版本的下载&#xff0c;选择合适的版本进行安装 二、配置文件注解 重点的几个参数进行注释&#xff1a; 1、listen 要监听的服务的端口&#xff0c;符合这个端口的才会被监听 server_name要监听的服务地址&#xff0c;可能是ip,也可能是域名&#xf…

流量书单,互联网营销必读

《流量池》杨飞 《增长黑客》肖恩埃利斯(Sean Ellis)、摩根布朗(Morgan Brown) 《增长五线》王赛 《参与感》黎万强 《场景革命》吴声 《网络营销实战密码》昝辉 《网络营销推广实战宝典》江礼坤 《超级IP&#xff0c;互联网新物种方法论》吴声 《周鸿祎自述&#xff0…

Golden Software Surfer v25 解锁版下载与安装教程 (三维绘图软件)

前言 Golden Software Surfer 是一款三维绘图软件&#xff0c;具备强大的插值功能和绘制图件能力&#xff0c;可用来处理XYZ数据&#xff0c;轻松绘制专业三维图。该软件有着很直观的用户界面&#xff0c;尽管不支持中文&#xff0c;但是很用户在熟悉流程以后依然能够轻松学会…

《计算机网络》(学习笔记)

目录 一、计算机网络体系结构 1.1 计算机网络概述 1.1.1 计算机网络的概念 1.1.2 计算机网络的组成 1.1.3 计算机网络的功能 1.1.4 电流交换、报文交换和分组交换 1.1.5 计算机网络的分类 1.1.6 计算机网络的性能指标 1.2 计算机网络体系结构与参考模型 1.2.1 计算机…

SpringCloud Nacos的配置与使用

Spring Cloud Nacos的配置与使用 文章目录 Spring Cloud Nacos的配置与使用1. 简单介绍2. 环境搭建3. 服务注册/服务发现4. Nacos 负载均衡4.1 服务下线4.2 权重配置4.3 同集群优先访问 5. Nacos 健康检查5.1 两种健康检查机制5.2 服务实例类型 6.Nacos 环境隔离6.1 创建namesp…