Minigpt4实战搭建

news2025/4/4 1:25:40

简介

Minigpt4虽然放出了网页版但是使用后发现网页体验的话，由于并发量比较大，很容易突然卡顿的现象，所以下面我主要讲解一下如何进行本地部署。

之前文章已经介绍过Minigpt4了这里就不重复赘述了，不了解的可以去看看https://blog.csdn.net/qq_45066628/article/details/130231186?spm=1001.2014.3001.5501

在这里插入图片描述
由于经费有限我这里使用的是7B模型，按照文档中所说，7B模型大概需要12G左右，而13B需要24G。

搭建过程

1.环境搭建

我这里使用的是Conda环境，Conda搭建过程比较简单就不赘述了，有不会的可以自行搜一下，按照教程按照就行。
装好Conda后还需要安装Cuda和torch（安装官网教程操作就行）
Cuda:https://developer.nvidia.com/cuda-toolkit
Torch:https://pytorch.org/get-started/locally/
Cuda安装好后执行ncvv -V命令看到有输出表示cuda安装成功
Torch安装后执行以下代码检查是否安装成功
```
import torch
torch.cuda.is_available()
```

2.模型下载

1.下载相关模型

v0版和v1版这，里我更加推荐v1版本，相对来讲会bug少点，具体选择更具自己

第一种方法：

直接下载即可
7b地址(v1)：https://huggingface.co/lmsys/vicuna-7b-delta-v1.1/tree/main
13b地址(v0)：https://huggingface.co/lmsys/vicuna-13b-delta-v0/tree/main
在这里插入图片描述

第二种方法：

1.使用git拉取vicuna模型

v0版：

git clone https://huggingface.co/lmsys/vicuna-13b-delta-v0  # more powerful, need at least 24G gpu memory
# or
git clone https://huggingface.co/lmsys/vicuna-7b-delta-v0  # smaller, need 12G gpu memory

v1版:

git clone https://huggingface.co/lmsys/vicuna-13b-delta-v1  # more powerful, need at least 24G gpu memory
# or
git clone https://huggingface.co/lmsys/vicuna-7b-delta-v1  # smaller, need 12G gpu memory

2.使用git拉取llama模型

git clone https://huggingface.co/decapoda-research/llama-13b-hf
# or
git clone https://huggingface.co/decapoda-research/llama-7b-hf

3.关联vicuna和llama模型

拉取完成后，就可以将其关联起来，这里使用工具为官方为了适配两个模型装门开发的FastChat，如果没有梯子或者其它加速手段，建议源码编译安装。

git clone https://github.com/lm-sys/FastChat.git
cd FastChat/
pip3 install --upgrade pip  # enable PEP 660 support
pip3 install -e .

安装没问题执行

python -m fastchat.model.apply_delta --base /path/to/llama-13bOR7b-hf/  --target /path/to/save/working/vicuna/weight/  --delta /path/to/vicuna-13bOR7b-delta-v0/

2.预训练模型下载

|–|—

name	download
Checkpoint Aligned with Vicuna 7B	https://drive.google.com/file/d/1RY9jV0dyqLX-o38LrumkKRh6Jtaop58R/view?usp=sharing
Checkpoint Aligned with Vicuna 13B	https://drive.google.com/file/d/1a4zLvaiDBr-36pasffmgpvH5P7CKmpze/view?usp=share_link

3.配置文件修改

1.修改eval_configs/minigpt4_eval.yaml下的ckpt对应的value，改为下载的预训练模型路径
在这里插入图片描述
2.修改minigpt4/configs/models/minigpt4.yaml下的llana_model，改为下载的vicuna和llama模型的路径

4.运行项目

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml  --gpu-id 0

运行后在浏览器输入localhost:7860
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/598564.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Minigpt4实战搭建

简介

搭建过程

1.环境搭建

2.模型下载

1.下载相关模型

第一种方法：

第二种方法：

1.使用git拉取vicuna模型

2.使用git拉取llama模型

3.关联vicuna和llama模型

2.预训练模型下载

3.配置文件修改

4.运行项目

相关文章

使用python开发“魂斗罗”游戏

结构化文档发布的故事和性能调优

C语言——数据在内存中的存储（下）

【代码规范】Google开源项目风格指南

基于卡尔曼滤波实现线性目标跟踪

Three.js--》实现3d字体模型展示

前后端交互模型http协议Ajax简介

信号机制上（信号概念、发送、定时器、信号捕捉、SIGCHLD）

连接MQTT服务端

HBase 的关键流程解析

【Python爬虫】采集电商商品评价信息

Linux下C语言文件描述符操作(dup / dup2 / sendfile / splice / tee)

Java基础（maven）——maven新建项目常用IO工具 Durid数据库工具案例

chatgpt赋能python：Python中的转置函数-一种简单而高效的矩阵操作

追寻幸福：探索幸福的关键特征和行为

【数据结构】难度上一个台阶的二叉树实现

K8S系列文章之快速入门K8S

ChatGPT出来后，为什么老有人想让我们程序员失业？

【LeetCode每日一题】——1248.统计「优美子数组」

NVIDIA NCCL 源码学习（十）- 多机间ncclSend和ncclRecv的过程