开源GPT-4小羊驼(Vicuna)快速上手指南

news2026/2/14 5:25:45

小羊驼（Vicuna)是什么

Vicuna: 一个开源的GPT，宣称实现了GPT-4 90%的功能。
UC伯克利学者联手CMU、斯坦福等，再次推出一个全新模型70亿/130亿参数的Vicuna，俗称「小羊驼」（骆马）。
并且和其他以往不同的是你可以在自己的设备上跑起来！比如Mac，再比如你的主力机！

官网在这：https://vicuna.lmsys.org
体验点这个（如果打不开就用魔法）：https://chat.lmsys.org
在这里插入图片描述

一.环境准备

ubuntu 20.04 （自带python3，且版本满足要求）
硬盘大约200G左右（100G也不是不能用，最好是200G，50G肯定是不行）
内存（计划用vicuna-7b的30G，vicuna-13b的60G，选哪个大家自己按需，满分100的话7b大概是40分，13b的话大概70分）
显卡（越贵越好，风浪越贵鱼越大）
以我自己的环境为例:
1.E5-2697-V2，64G内存，没有用显卡，能跑但是速度十分难受。
2.Macbook Pro M1 pro版本16+512，7b的能跑，效果还行。

二.开始操作

1.LLaMa模型下载与转换

1.1 模型下载
磁力链接：magnet:?xt=urn:btih:b8287ebfa04f879b048d4d4404108cf3e8014352&dn=LLaMA
大家自行按需下载
在这里插入图片描述
以7b为例下载之后的模型长这样

在这里插入图片描述
这里我下载的路径是/home/douding/LLaMA
1.2 模型转换

$ git clone https://github.com/huggingface/transformers.git
$ cd transformers
7B参考下面的
$ python3 src/transformers/models/llama/convert_llama_weights_to_hf.py \
    --input_dir /home/douding/LLaMA --model_size 7B --output_dir ./output/llama-7b
 13B看这个
 $ python3 src/transformers/models/llama/convert_llama_weights_to_hf.py \
    --input_dir /home/douding/LLaMA --model_size 13B --output_dir ./output/llama-13b

转换完成后会在/home/douding/transformers/output中看到你的模型
在这里插入图片描述

2.小羊驼模型合并与生成

$ pip3 install fschat
$ pip3 install git+https://github.com/huggingface/transformers

7b参考如下
$ git clone https://huggingface.co/lmsys/vicuna-7b-delta-v0
 注意这里需要手动下载大文件到/home/douding/lmsys/vicuna-7b-delta-v0中

在这里插入图片描述

$ python3 -m fastchat.model.apply_delta \
    --base /home/douding/transformers/output/llama-7b \
    --target /home/douding/vicuna-7b \
    --delta /home/douding/lmsys/vicuna-7b-delta-v0

 13b参考如下
 $git clone https://huggingface.co/lmsys/vicuna-13b-delta-v0 /home/douding/lmsys/vicuna-13b-delta-v0

注意这里需要手动下载大文件到/home/douding/lmsys/vicuna-13b-delta-v0中
在这里插入图片描述

 $ python3 -m fastchat.model.apply_delta \
    --base /home/douding/transformers/output/llama-13b \
    --target /home/douding/vicuna-13b \
    --delta /home/douding/lmsys/vicuna-13b-delta-v0

成功后会对应的目录/home/douding/vicuna-7b和/home/douding/vicuna-13b中看到对应的小羊驼模型
在这里插入图片描述

我这里提供已经做好了的小羊驼模型（含7b和13b)：
链接: https://pan.baidu.com/s/1t2He47-qDCYYJ38pak_beQ?pwd=w9nw 提取码: w9nw

3.运行

CPU纯享版

python3 -m fastchat.serve.cli --model-path /path/to/vicuna/weights --device cpu

GPU畅爽版

python3 -m fastchat.serve.cli --model-path /home/douding/vicuna-7b

Mac勉强享受版

python3 -m fastchat.serve.cli --model-path /home/douding/vicuna-7b --device mps --load-8bit

贴一张运行成功的截图，虽然满慢，但……充钱就可以变强！

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/425020.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

开源GPT-4小羊驼(Vicuna)快速上手指南

小羊驼（Vicuna)是什么

一.环境准备

二.开始操作

1.LLaMa模型下载与转换

2.小羊驼模型合并与生成

3.运行

CPU纯享版

GPU畅爽版

Mac勉强享受版

相关文章

数据库管理-第六十五期 Oracle 23c新特性（20230411）

静态时序分析Static Timing Analysis1——STA概述、标准工艺库、时钟、IO约束的建立

2023年4月的编程语言排行榜，有你中意的开发语言吗？

Linux03——文件系统及结构、命令

Java每日一练(20230411)

京东技术专家首推:Spring微服务架构设计，GitHub星标128K

SAP开发环境ABAP的搭建(客户端和服务器),Developer Key和AccessKey的绕过方法

C语言——变参函数

jenkins的slave节点构建java失败

Markdown基础语法：快速入门指南

从手动实现web开发到借助IDEA实现web开发的具体流程分析,详细介绍webapp的目录结构和web站点的欢迎页面的设置

闭环控制里的采样周期和执行周期

Python一行命令搭建HTTP服务器并外网访问【内网穿透】

20从零开始学Java之牛闪闪的for循环是怎么用的？

面试篇-Java输入输出三兄弟大比拼：IO、NIO、AIO对比分析

Android进阶宝典—事件冲突的解决方法

c++的多态

人人都是数据分析师-数据分析之数据图表可视化（下）

QT网络通信-服务器（一）

JavaEE简单实例——一些基本操作