【MiniGPT-4】手把手教部署

news2025/1/19 22:30:16

最近MiniGPT4开源了,获得了很多网友好评,在Github上获得了1.6万的star,它相比ChatGPT3.5来说,可以实现图片识别,生成想要的文本效果,理解能力非常强。

  • 论文地址:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

  • 论文主页:https://minigpt-4.github.io/

  • 代码地址:https://github.com/Vision-CAIR/MiniGPT-4

目录

一、MiniGPT-4网页版体验

1.1 用图片写一首诗 

1.2 网页版缺点 

二、安装环境依赖

2.1 下载Github项目

2.2 搭建pytorch环境

2.3 安装依赖包 

三、下载相关模型

3.1 下载LLaMa 全量模型

3.2 下载Vicuna的delta增量权重 

3.3 更新模型权重

3.4 准备预训练MiniGPT-4权重 

四、运行MiniGPT-4

4.1 报错解决

4.2 大功告成 


 

一、MiniGPT-4网页版体验

1.1 用图片写一首诗 

MiniGPT-4 联网体验网址为:Minigpt-4

 

根据一张图片写一首诗,体验效果如下:

 

翻译成中文:

一个小男孩高高地站在草地上、
手中拿着网,他准备好了要过。
头顶的天空晴朗而湛蓝、
一个完美的日子,适合捕捉一些乐趣。

男孩仰望天空、
脸上带着微笑,他已准备好飞翔。
他轻松地举起他的网、
看着蝴蝶走近。

蝴蝶飞来飞去,翩翩起舞、
男孩用手轻轻地捕捉着它们。
他很有耐心,一动不动、
当他等待着完美的收获时。

阳光照在他的脸上、
温暖着他的皮肤,使他感到安心。
他被大自然的美丽所包围、
他对这种宁静心存感激。

男孩的心中充满了喜悦、
当他看着蝴蝶飞翔。
他已经找到了对大自然的热爱、
它将永远在他身边。

所以让我们都花点时间
欣赏我们周围的美景。
让我们珍视简单的事物、
并在我们所做的一切中找到快乐。

1.2 网页版缺点 

可以发现,根据图片写的诗句还是比较优美的,但是网页体验的话,由于并发量比较大,很容易突然卡顿的现象,下面我主要讲解一下如何进行本地部署。

二、安装环境依赖

2.1 下载Github项目

GitHub - Vision-CAIR/MiniGPT-4: MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models

2.2 搭建pytorch环境

window系统搭建pytorch环境可参考:
Anaconda安装Pytorch(win系统)_Dr.sky_的博客-CSDN博客

2.3 安装依赖包 

方法一:

cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

方法二:

将MiniGPT-4/environment.yml 中需要安装的依赖包都拷贝到requirement.txt文件中(下图为部分安装包截图),并用pip安装:

 

三、下载相关模型

3.1 下载LLaMa 全量模型

LLaMa-7B模型下载地址:

decapoda-research/llama-7b-hf at main (huggingface.co)

LLaMa-13B模型下载地址(我用的):

 decapoda-research/llama-7b-hf at main (huggingface.co)

3.2 下载Vicuna的delta增量权重 

vicuna-7b-delta-v1.1下载地址:

lmsys/vicuna-7b-delta-v1.1 at main

vicuna-13b-delta-v1.1下载地址(我用的):

lmsys/vicuna-13b-delta-v1.1 at main 

vicuna-7b-delta-v1.0下载地址:

lmsys/vicuna-7b-delta-v0 at main

vicuna-13b-delta-v0下载地址:

lmsys/vicuna-13b-delta-v0 at main (huggingface.co) 

3.3 更新模型权重

pip install git+https://github.com/lm-sys/FastChat.git@v0.1.10
pip install fastchat
python -m fastchat.model.apply_delta --base llama-13b-hf的路径/  --target weight/(更新权重存放的路径)  --delta vicuna-13b-delta-v1.1的路径/

然后,在模型配置文件中修改权重路径为minigpt4—configs—models—minigpt4.yaml第16行 

3.4 准备预训练MiniGPT-4权重 

Checkpoint Aligned with Vicuna 13BCheckpoint Aligned with Vicuna 7B
下载下载

我下载的是13B权重

然后,在模型配置文件中修改权重路径为minigpt4—eval_configs—minigpt4_eval.yaml第11

 

四、运行MiniGPT-4

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml  --gpu-id 0

4.1 报错解决

运行上述代码,出现以下报错:

 

解决方法: 

4.2 大功告成 

 

复制生成网址链接,在浏览器可以轻松方式,大功告成! 

 

参考内容:

1. 手把手教学!在本地部署自己的MiniGPT4模型 

2. MiniGPT-4/environment.yml at main · Vision-CAIR/MiniGPT-4 · GitHub 

3.  icey-zhang/miniGPT4_guide: miniGPT4的本地复现 (github.com)

4. RiseInRose/MiniGPT-4-ZH: MiniGPT-4 中文部署翻译 完善部署细节 (github.com) 

5. MiniGPT-4本地部署,纯新手小白踩过的坑 (wolai.com) 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/469417.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【大数据之Hadoop】二十一、MapReduce、HDFS、Yarn配合工作(作业提交全过程)

1-11、26为Yarn;12-17为HDFS写数据流程;18-25、27-31为MapReduce;19-25为Shuffle;32-41为HDFS写数据流程。 (0)MR程序提交到客户端所在的节点,在集群模式中运行MR程序,当运行到主函…

数学建模第七天:数学建模算法篇之插值及MATLAB实现

目录 一、前言 1、引例 2、拟合定义 3、拟合与插值的关系 二、拟合 1、线性最小二乘法求解 ①思路 ②解法 2、MATLAB对线性最小二乘拟合的实现 ①函数说明 ②求解例题 3、MATLAB实现非线性曲线拟合 ①lsqcurvefit函数 ②代码求解 4、MATLAB实现非线性最小二乘拟…

华为2023暑期笔试(2-2)——最近最少使用(LRU, Least recently used)缓存算法

目录 题目内容解答要求(解答要求限制了只能使用LRU)输入描述样例思路代码 题目内容 你是一名网络工程师,你正在为一家云计算公司开发一个虚拟机管理系统。你的系统需要为每个虚拟机分配一个唯一的ID,用来标识和通信。为了实现这个…

C++基础demo(C++入门基础案例)

C入门基础案例学习与了解 demo16 计算年份是否为闰年(各种运算符结合)demo17 打印ASCII码表demo18 求完数demo19 密码验证(if……else)demo20 图书管理(if…else if…else)demo21 信号灯(和--&a…

python中使用ctypes库调用使用MMDeploy C++ SDK编译得到的dll文件时,出现WinError126的解决方法

之前,通过以下两篇文章,着重介绍了,使用openMMLab开发的MMDeploy库对MMxx系列仓库训练得到的权重pth转换得到的onnx,并分别使用python SDK和C SDK进行调用的详细步骤: 使用MMDeploy(预编译包)转…

Enterprise:如何在 Elastic 企业搜索引擎中添加对更多语言的支持

作者:Ioana-Alina Tagirta Elastic App Search 中的引擎(engines)使你能够索引文档并提供开箱即用的可调搜索功能。 默认情况下,引擎支持预定义的语言列表。 如果你的语言不在该列表中,此博客将说明如何添加对其他语言…

RabbitMQ笔记

一、MQ与RabbitMQ概述 1. MQ简述 MQ(Message Queue)消息队列,是基础数据结构中 “先进先出” 的一种数据结构,也是在消息的传输过程中保存消息的容器(中间件),多用于分布式系统之间进行通信。 …

[Pandas] 设置DataFrame的index索引起始值为1

导入数据 import pandas as pddf pd.DataFrame([[liver,E,89,21,24,64],[Arry,C,36,37,37,57],[Ack,A,57,60,18,84],[Eorge,C,93,96,71,78],[Oah,D,65,49,61,86]], columns [name,team,Q1,Q2,Q3,Q4]) df 上述DataFrame中的index索引列默认是从0开始的,那么我们…

【Spark】Spark是什么?能干什么?有什么特点?

一、什么是Spark 官网:http://spark.apache.org Apache Spark™ is a multi-language engine for executing data engineering, data science, and machine learning on single-node machines or clusters. Spark是一种快速、通用、可扩展的大数据分析引擎&#xf…

MATLAB连续LTI系统的时域分析(十)

目录 1、实验目的: 2、实验内容: 1、实验目的: 1)掌握利用MATLAB对系统进行时域分析的方法; 2)掌握连续时间系统零输入响应的求解方法; 3)掌握连续时间系统零状态响应、冲激响应和…

AD9739配置解析与数据输出指南

1 概述 本文用于AD9737芯片的配置使用情况,以及数据输出的格式说明情况,数据速率的计算情况等。 AD9739是ADI公司的一款14BIT,可达2.5GSPS采样率的DAC芯片。 2 AD9739的性能 支持的输入数据速率:1.6GSPS TO 2.5GSPS. industry lea…

基于3D渲染和基于虚拟/增强现实的IIoT原理的数字孪生平台的方案论文阅读笔记

基于3D渲染和基于虚拟/增强现实的IIoT原理的数字孪生平台的方案论文阅读笔记 论文原文链接:https://ieeexplore.ieee.org/abstract/document/9039804 本笔记对部分要点进行了翻译和批注,原文和翻译可参考链接阅读,此处不进行完整翻译。 论文…

【服务网格】Service Mesh 是什么?为我们解决了什么问题?

文章目录 背景一、Service Mesh 介绍Service Mesh的定义Service Mesh 诞生 二、Service Mesh 解决的问题三、Service Mesh 的原理四、Service Mesh具体是怎么实现的?Istio是什么?istio架构和主要功能Istio 1.5.1 性能总结Istio与Kubernetesistio的实战案…

四、MyBatis获取参数值的两种方式(重点)

文章目录 四、MyBatis获取参数值的两种方式(重点)4.1 单个字面量类型的参数4.2 多个字面量类型的参数4.3 map集合类型的参数4.4 实体类类型的参数4.5 使用Param标识参数 四、MyBatis获取参数值的两种方式(重点) MyBatis获取参数值…

IP-GUARD屏幕记录能实现平时不记录,特定操作触发记录吗?

支持触发性屏幕记录。部分策略有选项“记录屏幕”,勾选后,策略触发时,会自动记录客户端当时的屏幕情况,记录次数和间隔可通过配置修改。 所有包含了记录屏幕的策略有: 应用程序、上网浏览、流量控制、网络控制、邮件控制、IM传送控制、上传控制、文档控制、打印控制、敏感…

深浅拷贝,类型检测及继承面试题

01 对象的深/浅拷贝 1.1 变量的存储 基本类型:基本类型的值存在栈内存中 引用类型: 引用类型的地址存储在栈内存中,他的值存储在堆内存中,通过指针(地址)连接 1.2 变量拷贝 基本类型:基本类型拷贝的是值 引用类型…

达梦数据库中,如何设置表的访问控制权限?

在工作中,大家都会遇到这样的场景,出于对数据库访问安全的考虑,对于某些用户我们不想让他们看到全库的表,只想给他们特定表的访问权限。那么在DM数据库中我们该如何去配置相应的权限呢? 我们下面来进行详细解析。 我们…

buuctf6

目录 [ACTF2020 新生赛]BackupFile [RoarCTF 2019]Easy Calc 利用PHP的字符串解析特性Bypass: http走私攻击 来首歌吧 荷兰宽带数据泄露​编辑 面具下的flag [ACTF2020 新生赛]BackupFile 1.打开环境 查看源代码得不到任何想要的信息,使用目录扫描来得到我们…

关于秒杀系统的一系列问题

阻塞队列怎么么实现?超卖问题?整体怎么实现? 5 设计一个秒杀系统 特点:高并发,请求量远大于库存量,只有少数能成功;逻辑比较简单,下单减库存; 设计理念:**限…

ESP8266基于Lua开发点灯示例

ESP8266基于Lua开发点灯示例 ✨基于ESPlorer IDE:https://github.com/4refr0nt/ESPlorer/releases🔧固件烧录工具:NodeMCU-PyFlasher🌿esp8266烧录工具下载:https://github.com/marcelstoer/nodemcu-pyflasher/release…