Star History 月度开源精选|Llama 2 及周边生态特辑

news2024/10/7 14:24:52

7 月 18 日,Meta 发布了 Llama,大语言模型 Llama 1 的进阶版,可以自由免费用于研究和商业,支持私有化部署。
所以本期 Star History 的主题是:帮助你快速把 Llama 2 在自己机器上跑起来的开源工具,无论你的机器是什么!

file

Llama

file

Llama 本身是个开源的基础大语言模型 (LLM),由网上公开可获取到的数据训练完成。它于今年 2 月正式开源,五个月之后就发布了新一代版本,Llama 2。
相比原版,Llama 2 在 2 万亿个标记上进行了训练,上下文长度翻了一倍,有 3 种不同大小的参数:7B, 13B 和 70B,参数的区别在于你希望使用更小、更快速的还是准确性更高的模型?

file

llama.cpp

file

llama.cpp 是在 Meta 官方公告里提到的社区在 Llama 上实现的成果之一,用 C++ 重写了 Llama 的推理代码,通过一些优化和量化权重,颠覆了我们的认知:它可以在普通硬件上本地快速运行大型 LLM,比如可以

  • 在 Google Pixel5 上,以 1 token/s 的速度运行 7B 参数模型。
  • 在 M2 Macbook Pro 上,以 16 token/s 运行 7B 参数模型。
  • 在 4GB RAM 的 Raspberry Pi 上运行 7B 模型,速度 0.1 token/s。

这个项目是如此成功,以至于作者 Georgi Gerganov 把自己的 side project 正式成立为了一家初创公司 ggml.ai (这是个用于机器学习的张量库,llama.cpp 和 whisper.cpp 的背后都用着它)

file

Ollama

file

Ollama 为运行、创建和分享大型语言模型(比如 Llama 2)而设计,现支持 macOS 系统,Windows 和 Linux 用户暂时需要自己通过源码编译。下好 Ollama 后,运行 ollama run llama2 就可以在你的 Mac 上用 Llama 2 了。

file

Ollama 的作者之前在 Docker 工作过,开源语言模型的兴起让他觉得大型语言模型也需要类似的东西,所以就有了为预先编译好的包,而用户可以自己调节一些参数。

MLC LLM

file

MLC LLM 旨在让你能在任何设备上开发、优化和部署 AI 模型。任何语言模型都可以在各种硬件后端和本地应用程序上原生部署(支持的设备包括各种移动端,平板端,电脑端,和 Web 浏览器),无需服务器支持,你也可以进一步优化模型性能,以适应自己的使用场景。
MLC Chat 已经在苹果应用市场上线了,现支持 Llama-2-7b 模型,好奇的小编立刻试用了一下,很简单好用,就是手机容易发烫😅。(题外话:感觉 Llama 2 还有很大增长空间呀)

file

LlamaGPT

file

LlamaGPT 实力证明了 AI 浪潮依然强劲,五天前才开源,GitHub 现在已经有 6.6K 星星了。
它是个自托管的聊天机器人,体验类似 ChatGPT,不会将任何数据传输到外部设备,目前三种 Llama 的模型都已经支持上了,背后也用到了之前提到的 llama.cpp。所以和前的几个工具相比的话,LlamaGPT 是一个更完整的应用程序,包含了 UI,也不需要手动设置任何内容、优化参数,这应该是最适合非技术人员用上 Llama 2 的方法了。

file

最后
作为开源、免费、可商用的大语言模型,Llama 把我们和 AI 的距离又拉近了一些,虽然相比一些收费模型,Llama 还是差了一点意思,但是就像 Meta 在新闻通稿里提到的「我们经历了开源带来的好处,比如 React 和 PyTorch ,这些已经成为整个技术行业常用基础设施。我们相信公开分享大型语言模型将支持有益且更安全地生成 AI 技术的发展。」相信有了社区的力量,Llama 和周边生态会越来越棒😆

最后的最后,当然,还有很多其他方式用上 Llama 2:比如通过 Homebrew 下载,Poe,等等等等,更多可以参考以下:

  • https://simonwillison.net/2023/Aug/1/llama-2-mac/
  • https://huggingface.co/blog/llama2
  • https://replicate.com/blog/run-llama-locally

💡 你可以访问官网,免费注册云账号,立即体验 Bytebase。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/916038.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生信学院|08月25日《SOLIDWORKS PDM帮助企业对设计数据版本的管理应用》

课程主题:SOLIDWORKS PDM帮助企业对设计数据版本的管理应用 课程时间:2023年08月25日 14:00-14:30 主讲人:车立洋 生信科技 PDM专家 1、图纸&文档的版本管理对于企业的重要性 2、SolidWorks PDM对图纸&文档版本的管理 3、SolidW…

浅析阿里云灵积(平台)模型服务

简介: DashScope灵积模型服务以模型为中心,致力于面向AI应用开发者提供品类丰富、数量众多的模型选择,并为其提供开箱即用、能力卓越、成本经济的模型服务API。DashScope灵积模型服务依托达摩院等机构的优质模型,在阿里云基础设施…

Ubuntu22.04利用lightdm替换gdm3出现的问题或Bug

Ubuntu22.04利用lightdm替换gdm3出现的问题或Bug 问题1:快捷键无法使用问题2:qq_music打开失败问题3:微信截图收发文件的解决问题4:Dock以及plank问题的解决随时更新补充中ing... 问题1:快捷键无法使用 修复输入法的问…

【VR】SteamVR2.0的示例场景在哪里

💦本专栏是我关于VR开发的笔记 🈶本篇是——在哪里可以找到SteamVR2.0的示例场景 SteamVR2.0的示例场景在哪里 1. 逐步打开方式2. 快速打开方式 1. 逐步打开方式 Assets——SteamVR——InteractionSystem——Samples——>Interactions_Example 2. 快…

17.8k Star!开源且支持私有化部署的碎片化知识卡片管理工具-Memos

应用简览 Memos 是一个开源的轻量级笔记服务应用,它为用户提供了一个随时记录思绪和想法的私密空间,同时它支持私有化部署,这意味你可以完全掌控你的数据和隐私,同时它还提供了直观的分享功能,让你可以轻松地与他人协作…

用 Audacity 比较两段音频差异

工作中遇到相同的处理流程,处理同一段音频,看看处理结果是否一致,可以用audacity来处理。 假设待比较的音频分别为 1.wav 2.wav 1、用Audacity打开1.wav 2、用Audacity打开2.wav,选中音频,然后用 效果 -> 反向&am…

React项目build打包后,页面空白的解决方案

问题描述: React项目执行 build 命令后,在本地服务器打开页面 是空白的,而且控制台报错 如下图所示 解决方法 打开根目录下的 package.json 文件,添加如下代码 {"name": "testproject","version"…

冠达管理:创业板指是什么意思啊?

跟着我国经济的不断开展,越来越多的人开始进入股票商场。作为一个出资新手,你可能会对股票商场上的各种术语感到困惑,比方创业板指。 创业板指是什么? 创业板指是我国证监会于2009年6月1日推出的第二个股票指数,旨在衡…

公司核心文件数据防泄密系统——「天锐绿盾加密软件」

企业内每日的文档传输可能会发生成千上万次以上,已经成为最容易泄密的环节。在日常工作中,我们无法避免通过即时通讯工具、网络、邮件、移动设备等方式传输机密文档,那么我们该如何保障文档传输安全呢?为此天锐绿盾终端管理系统提…

如何优化因为高亮造成的大文本(大字段)检索缓慢问题

首先还是说一下背景,工作中用到了 elasticsearch 的检索以及高亮展示,但是索引中的content字段是读取的大文本内容,所以后果就是索引的单个字段很大,造成单独检索请求的时候速度还可以,但是加入高亮之后检索请求的耗时…

最新议程 | OffiSmart智慧办公及空间管理峰会

【OffiSmart智慧办公及空间管理峰会】是SSOT旗下品牌高峰论坛,自2019年在展会现场同期推出以来,邀请众多专家学者、企业高管、从业人员参与其中,收到行业多方称赞。 今年规模和精彩程度再度升级,覆盖所有人群和细分领域。以用户为…

计算机视觉入门 6) 数据集增强(Data Augmentation)

系列文章目录 计算机视觉入门 1)卷积分类器计算机视觉入门 2)卷积和ReLU计算机视觉入门 3)最大池化计算机视觉入门 4)滑动窗口计算机视觉入门 5)自定义卷积网络计算机视觉入门 6) 数据集增强(D…

jvs-rules(规则引擎)更新:新增功能介绍

jvs-rules更新内容 1.复合变量新增数据补充节点,实现请求回来的数据再以入参方式请求其他数据进行数据补充(例如通过参数A,请求回数据B,再以数据B为入参,请求回数据C) 2.规则流结束节点支持新增、新建、引…

【算法】活用双指针完成复写零操作

Problem: 1089. 复写零 文章目录 题目解析算法原理分析找到最后一个复写的位置从后往前进行复写操作 代码展示 题目解析 首先我们来分析一下本题的题目意思 可以看到题目中给到了一个数组,意思是让我们将数组中的零元素都复写一遍,然后将其余的元素向后平…

细菌感染后抗生素耐药性如何形成以及预测抗生素对肠道菌群的影响

谷禾健康 抗生素耐药性是当下和未来几十年人类健康将面临的重要挑战之一。从2000年到2015年,抗菌药物的普及导致人类抗生素消耗量增加了约65%,2015年后这个数据还在增加。最明显的后果是抗生素耐药性的增多,这使得近年来常见的感染难以治疗。…

网络聊天室

一、项目要求 利用UDP协议,实现一套聊天室软件。服务器端记录客户端的地址,客户端发送消息后,服务器群发给各个客户端软件。 问题思考 客户端会不会知道其它客户端地址? UDP客户端不会直接互连,所以不会获知其它客…

Flutter对象状态动态监听Watcher

场景:当一个表单需要在表单全部或者特定项赋值后才会让提交按钮可点击。 1.普通实现方式: ///场景:检查[test11][test12][test13]均不为空时做一些事情,例如提交按钮变成可点击String? test11;String? test12;int? test13;///当…

Linux后门大全-xinetd后门(二)

环境 靶机:centos7.6 攻击机:Linux 使用docker搭建靶机环境,当然也可以不使用docker,直接跳过创建容器的步骤即可 创建容器 #创建名为backdoorT4的特权容器,并使用/usr/sbin/init,因为容器默认不开启sy…

YOLOv5改进系列(23)——替换主干网络之MobileViTv2(移动视觉 Transformer 的高效可分离自注意力机制)

【YOLOv5改进系列】前期回顾: YOLOv5改进系列(0)——重要性能指标与训练结果评价及分析 YOLOv5改进系列(1)——添加SE注意力机制

Linux操作系统面试题汇总

Linux操作系统 1.Linux操作命令 Linux 目录结构及常用命令详细介绍参考 2.在Linux中find和grep的区别? 在Linux中,find命令用于按照指定条件搜索文件或目录,而grep命令则用于在文件中搜索指定的文本字符串。具体来说,find命令可…