目录
- Meta 发布全新发语言模型 Llama 3.1
- Apple 开源全新 AI 模型,挑战 Meta,打造高效 AI 生态
Meta 发布全新发语言模型 Llama 3.1
Llama 3.1 提供 8B、70B 和 405B 三种参数规模,其中 405B 版本在通用知识、可控性、数学、工具使用和多语 言翻译方面均达到业界领先水平。
升级后的 8B 和 70B 模型支持多语言,上下文长度扩展至 128K,具备先进的工具使用能力和更强的推理能力,可用于长文本摘要、多语言对话代理和编码助手等场景。
Meta 还更新了许可协议,允许开发者使用 Llama 模型(包括 405B 版本)的输出改进其他模型。
Llama 3.1 的主要优势:
- 三种参数规模,满足不同需求
- 405B 版本性能媲美 GPT-4 等顶级模型
- 升级后的 8B 和 70B 模型支持多语言和更长上下文
- 具备先进的工具使用能力和更强的推理能力
- 许可协议更加开放
Llama 3.1 的应用场景:
- 长文本摘要
- 多语言对话代理
- 编码助手
模型评估:
Meta 通过 150 多个基准数据集和大量人工评估,验证了 Llama 3.1 的性能优势。实验结果表明,Llama 3.1 在 各种任务上均具有竞争力,其旗舰模型可与 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 等领先基础模型相媲美。
终端用户可通过命令行方式获取相关模型:
# 安装 ollama
x ollama install
# 运行 Llama3.1 模型
x ollama run llama3.1:latest
# 查看本地已下载的模型
x ollama ls
使用案例:
来源:
https://ollama.com/library/llama3.1
Apple 开源全新 AI 模型,挑战 Meta,打造高效 AI 生态
苹果公司最近开源了其最新的70亿参数人工智能模型 DCLM,加入开源AI运动并挑战 Meta 等巨头。
这款模型虽然规模不大,但性能优异,在基准测试中表现超越 Meta 的 Mistral-7B,并接近谷歌同等规模模型。更重要的是,DCLM 模型的权重、训练代码和数据集全部开源,任何人都可以使用或改编,这与 Meta 即将发布的4000亿参数 Llama 3 形成鲜明对比。
苹果开发 DCLM 模型的目标是创建一个高效且高质量的数据集,并通过开源方式推动更广泛的 AI 生态系统建设。该模型训练使用的内容标记更少,但效率更高,性能与同等规模的其他模型相当。
苹果此举意义重大,它不仅为研究人员和公司提供了创建小型 AI 的机会,也为构建更加开放和透明的 AI 未来迈出了重要一步。正如 OpenAI 首席执行官萨姆·奥尔特曼所说,目标是创造出便宜到可以计量的智能,而苹果的开源模型正是这一理念的体现。
终端用户可通过命令行方式获取相关模型:
# 设置在全局环境中使用 huggingface-cli
x env use huggingface
# 从 HuggingFace Hub 下载 apple/DCLM-7B 模型
huggingface-cli download apple/DCLM-7B
# 扫描缓存目录,查看模型的相关信息
huggingface-cli scan-cache
使用案例:
来源:
-
https://www.tomsguide.com/ai/apple-takes-on-meta-with-new-open-source-ai-model-heres-why-it-matters
-
https://huggingface.co/collections/apple/dclm-66960ebf2400d314ff19018f
更多内容请查阅 : blog-240724
关注微信官方公众号 : oh my x
获取开源软件和 x-cmd 最新用法