BLIP2模型加载在不同设备上

BLIP2模型加载在不同设备上

news2026/2/12 0:51:03

背景

现在大语言模型越来越大，占用的内存越来越多，这导致内存较小的设备无法体验大模型的效果。transformer提供了将一个大模型分别加载在gpu和cpu上的方法。

加载方法

以多模态模型BLIP2为例，将其语言模型放在gpu上，其余部分放在cpu上。配置加载预加载模型的device_map.device_map可以设置为auto，则根据设备的显存情况，自动加载在gpu或者cpu上。
使用BLIP2模型地址

device_map = {'language_model':0,\
	'language_projection':'cpu', \
	'qformer':'cpu', \
	'query_tokens':'cpu', \
	'vision_model':'cpu'}
multimodal = Blip2ForConditionalGeneration.from_pretrained("huggingface_opt",torch_dtype=torch.float16,device_map=device_map)

如上所示，将language_model放在0号显卡上，其余模型放在cpu上。模型的名称在模型的index文件中
在这里插入图片描述
测试情况

加载位置	显存占用	耗时	备注
GPU	13G	0.5s
GPU +CPU	10G	2s	语言放在0号显卡上，其余模型放在cpu上

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1069766.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

1.10.C++项目：仿muduo库实现并发服务器之Acceptor模块的设计

1.10.C++项目：仿muduo库实现并发服务器之Acceptor模块的设计

一、Acceptor模块：这是一个对于通信连接进行整体管理的一个模块，对一个连接的操作都是通过这个模块来进行！ 二、提供的功能 Acceptor模块是对Socket模块，Channel模块的⼀个整体封装，实现了对⼀个监听套接字的整体的管…

阅读更多...

中国人民大学与加拿大女王大学金融硕士-----成功便是站起来比倒下多一次

中国人民大学与加拿大女王大学金融硕士-----成功便是站起来比倒下多一次

人生说短也短，说长也长。在有限的时间内，让我们按下“加速键”，收获生活或工作中的各种美好。人生的每一次加速，都距未来更近一步。身处金融领域的你，有想到比别人更快一步的拿到学位吗？中国人民大学与加拿…

阅读更多...

yolov5加关键点回归

yolov5加关键点回归

文章目录一、数据1）数据准备2）标注文件说明二、基于yolov5-face 修改自己的yolov5加关键点回归1、dataloader,py2、augmentations.py3、loss.py4、yolo.py 一、数据 1）数据准备 1、手动创建文件夹: yolov5-face-master/data/widerface/tr…

阅读更多...

K8S：K8S对外服务之Ingress

K8S：K8S对外服务之Ingress

文章目录一.Ingress基础介绍1.Ingress概念2.K8S对外暴露服务（service）主要方式（1）NodePort（2）LoadBalancer（3）externalIPs（4）Ingress 3.Ingress 组成&#x…

阅读更多...

JS进阶-原型

JS进阶-原型

原型原型就是一个对象，也称为原型对象构造函数通过原型分配的函数是所有对象所共享的 JavaScript规定，每一个构造函数都有一个prototype属性，指向另一个对象，所以我们也称为原型对象这个对象可以挂载函数，对象实…

阅读更多...

8 个 Promise 高级用法

8 个 Promise 高级用法

在 js 项目中，promise 的使用应该是必不可少的，但我发现在同事和面试者中，很多中级或以上的前端都还停留在promiseInst.then()、promiseInst.catch()、Promise.all等常规用法，连async/await也只是知其然，而不知其所以然…

阅读更多...

Vue3实现div拖拽改变宽高

Vue3实现div拖拽改变宽高

效果图如下： 底部拖拽按钮点击拖拽可自定义父容器的宽高 <template><div id"business_plane"><div class"business_plane" ref"container"><div class"darg_tool"><el-icon class"drag_H…

阅读更多...

JavaEE初阶学习:HTTP协议和Tomcat

JavaEE初阶学习:HTTP协议和Tomcat

1. HTTP协议 HTTP协议是一个非常广泛的应用层协议~~ 应用层协议 —> TCP IP 协议栈应用层 —> 关注数据怎么使用~ 传输层 —> 关注的是整个传输的起点和终点网络层 —> 地址管理路由选择数据链路层 —> 相邻节点之间的数据转发物理层 —> 基础设置,硬…

阅读更多...

Rocky(centos)安装nginx并设置开机自启

Rocky(centos)安装nginx并设置开机自启

一、安装nginx 1、安装依赖 yum install -y gcc-c pcre pcre-devel zlib zlib-devel openssl openssl-devel 2、去官网下载最新的稳定版nginx nginx: downloadhttp://nginx.org/en/download.html 3、将下载后的nginx上传至/usr/local下或者执行 #2023-10-8更新 cd /usr/…

阅读更多...

我在 NPM 发布了新包： con-colors

我在 NPM 发布了新包： con-colors

链接地址：npmjs.com con-colors 安装依赖 yarn add con-colors使用导入： import { print } from "con-colors";使用： print.succ("成功的消息"); print.err("失败的消息")例子： import { p…

阅读更多...

与诈蟹的初次邂逅，你中招了没

与诈蟹的初次邂逅，你中招了没

中秋国庆双节大家都过得怎么样？有没有吃到螃蟹？不管你们吃没吃到，反正东东是吃到螃蟹...的瓜了，四舍五入一下也算是吃到了吧。这不节后上班第一天，同事们就已经开始互相问候关于是否收到蟹卡的情况，一开始…

阅读更多...

vmware一键启动虚拟机系统脚本

vmware一键启动虚拟机系统脚本

bat脚本 "D:\Program Files (x86)\VMware\VMware Workstation\vmrun.exe" -T ws start "D:\Program Files (x86)\Ginkgo7000\C7-10.10.10.111\CentOS 7-NAS-6.vmx" 脚本内容说明 "D:\Program Files (x86)\VMware\VMware Workstation\vmrun.exe"…

阅读更多...

一般香港服务器带宽选多大够用？（带宽计算方法）

一般香港服务器带宽选多大够用？（带宽计算方法）

　　在海外IDC市场份额中，香港服务器依托自身优越的服务器资源条件，在各个行业中发挥的重要作用。但是，不同业务对网络带宽的要求各不相同，弄清楚如何计算带宽需求对于确保业务平稳运行至关重要，最好从一开始就使用正…

阅读更多...

研发质量管理体系

研发质量管理体系

研发质量管理体系的脉络是怎样的？如何建立适合组织发展的研发质量管理体系？质量管理的核心是什么？一些思考，一些线索，欢迎朋友们一起探讨、碰撞。

阅读更多...

Tensorflow入门之 Hello World

Tensorflow入门之 Hello World

Tensorflow入门之 Hello World 简介 Tensorflow 是 Google 开源的深度学习框架，来自于 Google Brain 研究项目，在 Google 第一代分布式机器学习框架 DistBelief 的基础上发展起来。 Tensorflow 的官方网址 http://www.tensorflow.org Tensorflow 的 G…

阅读更多...

基于Spring Boot和WebSocket的在线聊天室测试

基于Spring Boot和WebSocket的在线聊天室测试

1.测试目标设计可靠且全面的自动化测试用例，以覆盖项目的核心功能以及不同的使用场景。通过有效的测试策略和测试工具选择，提高测试效率，减少手动测试所需的工作量，从而加速项目的交付周期。保障持续集成与持续交付流程的顺利进…

阅读更多...

保护数据安全：防病毒防木马的重要性与策略

保护数据安全：防病毒防木马的重要性与策略

随着科技的进步，我们的生活已经离不开互联网。网络为我们的工作、学习、娱乐带来了极大的便利，但同时也带来了新的挑战——数据安全问题。病毒、木马等恶意软件，是威胁数据安全的主要因素。因此，我们必须采取有效的防病毒防木马措…

阅读更多...

react中预览excel表格

react中预览excel表格

查了很多资料，很多插件，有很多也用不了，最后试了xlsx这个插件，可以使用。话不多少了，直接放代码吧： 1.代码实现 fetch(API).then((res: any) > {res?.blob().then((r: any) > {const reader ne…

阅读更多...

论文降重：我从论文重复率75%降到4.5%，顺利毕业

论文降重：我从论文重复率75%降到4.5%，顺利毕业

去年我在撰写毕业论文的过程中遇到了一个巨大的挑战，那就是论文的重复率过高，高达75%。这个问题严重威胁着我的学位和未来职业发展，因此我决定付出一切努力来解决这个难题。在花费大量时间和努力后，并借助智元兔AI写作助手(http:/…

阅读更多...

【高效办公_PDF】如何快速批量整合多个PDF？？？---Python方法

【高效办公_PDF】如何快速批量整合多个PDF？？？---Python方法

高效办公 PDF 如何快速批量整合多个PDF？？？今日方法：如何使用Python代码实现合并当前目录PDF文件市场上当然有许许多多的形形色色的软件可以进行PDF整合等操作；那么我们用代码（r如：python怎么实现高效办公呢？） # [注] 在合并过程中，程序是按照所在文件夹的存放顺…

阅读更多...

推荐文章

最新文章