第十八节 LLaVA如何按需构建LORA训练(视觉、语言、映射多个组合训练)

第十八节 LLaVA如何按需构建LORA训练(视觉、语言、映射多个组合训练)

news2026/2/13 20:11:41

文章目录

前言
一、基于llava源码构建新的参数
- 1、添加lora_vit参数
- 2、训练命令脚本设置
二、修改源码，构建lora训练
- 1、修改源码-lora训练
- 2、LLM模型lora加载
- 3、VIT模型加载
- 4、权重冻结操作
- 5、结果显示
三、实验结果

前言

如果看了我前面文章，想必你基本对整个代码有了更深认识。实际上，大多大模型都是使用huggingface搭建，而大多LORA训练也是调用PEFT库。然而，LLaVA代码却没有相关VIT模型训练内容，也没有不同组合训练。而我也是想探索单独使用vit的lora训练、单独使用llm的lora训练或全都使用会有什么效果呢？因此，本篇文章将探索LLaVA如何按需构建LORA训练，我会给出如何构建参数与修改源码，也会给出我实验结果。实验结果表明，视觉、语言、映射三着结合训练基本没有效果，视觉与语言训练也不会有效果，而其它基本会有转好效果。

一、基于llava源码构建新的参数

1、添加lora_vit参数

我想使用一个参数来决定是否对视觉vit模型进行lora训练，而llm与映射训练已有相关参数可控制。为此，我们在TrainingArguments的参数中添加lora_vit变量，用此来控制是否视觉使用vit训练。其如图所示：

在这里插入图片描述

2、训练命令脚本设置

于是，我们可以使用训练命令脚本，我们只需设置lora_vit的bool，即可实现视觉部分训练。当然，我也修改了源码，使用lora_enable控制LLM模型是否训练，tune_mm_mlp_adapter控制映射层是否训练。最终，我们可以自由组合决定训练哪些模块。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1911459.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

技术速递｜VS Code Java 6月更新 - 项目设置功能增强！大量 Spring 新特性

技术速递｜VS Code Java 6月更新 - 项目设置功能增强！大量 Spring 新特性

作者：Nick Zhu 排版：Alan Wang 大家好，欢迎阅读 Visual Studio Code for Java 的六月更新！在这篇博客中，我们将分享项目设置项目的重要更新以及一系列 Spring 的功能改进，让我们开始吧！ 项目设…

阅读更多...

gitlab-runner安装部署CI/CD

gitlab-runner安装部署CI/CD

手动安装卸载旧版： gitlab-runner --version gitlab-runner stop yum remove gitlab-runner下载gitlab对应版本的runner # https://docs.gitlab.com/runner/install/bleeding-edge.html#download-any-other-tagged-releasecurl -L --output /usr/bin/gitlab-run…

阅读更多...

工业一体机为数字化工厂带来高效作业指导

工业一体机为数字化工厂带来高效作业指导

随着工业4.0的浪潮席卷全球，数字化工厂的概念深入人心。在这一背景下，工业一体机作为数字化转型的重要一环，凭借其强大的功能和灵活的应用，为工厂实现高效作业指导提供了强大的助力。一、工业一体机的优势：赋能数字化…

阅读更多...

解锁算力新极限，Xilinx UltraScale+赋能的高性能低延时FPGA加速卡

解锁算力新极限，Xilinx UltraScale+赋能的高性能低延时FPGA加速卡

01、产品概述 AiHPC-V9P 是一款基于 AMD Virtex UltraScale FPGA VU9P 的 PCIe Gen3.0 x16 接口智能网卡，具有最大2*200GbE /或者16*10GbE(典型应用）接入容量的高性能低延时智能网卡。对外接口支持两组QSFP-DD 最高25Gb/s x8Lane 光口接入&#xf…

阅读更多...

机场公厕厕位指引屏，布线简单，安装便捷

机场公厕厕位指引屏，布线简单，安装便捷

在人潮涌动的机场，公厕不仅是旅客的必需设施，更是衡量机场服务质量的重要指标。然而，传统机场公厕往往存在信息不透明、清洁维护滞后、高峰期拥挤等问题，严重影响了旅客的使用体验。近年来，随着智慧机场理念的兴起&…

阅读更多...

【第24章】MyBatis-Plus之SQL注入器

【第24章】MyBatis-Plus之SQL注入器

文章目录前言一、概述1. 使用场景2. 功能二、注入器配置三、自定义全局方法攻略1. 定义SQL2. 注册自定义方法3.定义BaseMapper4.配置SqlInjector 四、注意事项五、更多示例六、实战1. 定义SQL2. 注册自定义方法3.定义BaseMapper4.配置SqlInjector5. 测试类6. 结果总结前言 …

阅读更多...

如何使用IDEA快速清理无效代码(荣耀典藏版)

如何使用IDEA快速清理无效代码(荣耀典藏版)

大家好，我是月夜枫。今天分享一下IDEA中很有实用价值的Analyze，那么Analyze是用来做什么的呢？ 主要用来清理没有引用的代码，包括方法、实体类以及没有使用的Mapper和Service等。为了是项目更加整洁，可以使用Idea中…

阅读更多...

(十六)视图变换正交投影透视投影

(十六)视图变换正交投影透视投影

视图变换代码实验 #include <glad/glad.h>//glad必须在glfw头文件之前包含 #include <GLFW/glfw3.h> #include <iostream> #define STB_IMAGE_IMPLEMENTATION #include "stb_image.h"//GLM #include <glm/glm.hpp> #include <glm/gtc/m…

阅读更多...

SECS/GEM快速完成半导体设备通讯

SECS/GEM快速完成半导体设备通讯

金南瓜帮助国内大量从事半导体前道设备开发研制、生产的设备厂商，通过快速提供稳定可靠的SECS/GEM、GEM300产品，为客户在激光退火、湿法设备（清洗、镀膜等）、离子注入、MOCVD、PVD等客户专注于核心工艺提升，提升企业的…

阅读更多...

【Python进阶】继承进阶和私有权限

【Python进阶】继承进阶和私有权限

目录一、继承进阶 1、方法重写 2、调用父类方法 3、多层继承二、私有权限 1、私有属性 2、私有方法面向对象基础：小白也能看懂的Python基础教程（8）-CSDN博客一、继承进阶 1、方法重写当父类的同名方法达不到子类的要求&#x…

阅读更多...

AR增强现实汽车装配仿真培训系统开发降低投入费用

AR增强现实汽车装配仿真培训系统开发降低投入费用

随着互联网的无处不在，AR增强现实技术正逐步融入我们生活的每一个角落。深圳华锐视点作为一家引领行业潮流的AR内容开发的技术型公司，正以其卓越的技术实力和专业的服务团队，推动着国内AR技术向更加成熟和多元化的方向迈进。深圳华锐视点提供…

阅读更多...

2024年文化研究与数字媒体国际会议 (CRDM 2024)

2024年文化研究与数字媒体国际会议 (CRDM 2024)

2024年文化研究与数字媒体国际会议 (CRDM 2024) 2024 International Conference on Cultural Research and Digital Media 【重要信息】大会地点：珠海大会官网：http://www.iccrdm.com 投稿邮箱：iccrdmsub-conf.com 【注意：稿将…

阅读更多...

深入探索联邦学习框架 Flower

深入探索联邦学习框架 Flower

联邦学习框架本文主要期望介绍一个设计良好的联邦学习框架 Flower，在开始介绍 Flower 框架的细节前，先了解下联邦学习框架的基础知识。作为一个联邦学习框架，必然会包含对横向联邦学习的支持。横向联邦是指拥有类似数据的多方可以在不泄露…

阅读更多...

【算法】代码随想录之数组（更新中）

【算法】代码随想录之数组（更新中）

文章目录前言一、二分查找法（LeetCode--704） 二、移除元素（LeetCode--27） 前言跟随代码随想录，学习数组相关的算法题目，记录学习过程中的tips。一、二分查找法（LeetCode--704&#xff0…

阅读更多...

【环境准备】 Vue环境搭建

【环境准备】 Vue环境搭建

文章目录前言vue-cli 安装创建项目3.0、以下3.0 、以上前言书接上回《NodeJs(压缩包版本)安装与配置》，安装完了NodeJs，接下来就要配置vue的环境了。 vue-cli 安装安装vue-cli输入如下命令 #（安装的是最新版） npm install …

阅读更多...

Nacos 国际化

Nacos 国际化

项目需要，后端异常信息需要进行国际化处理。所以想有没有方便易用的可选项。 1、国际化配置调整，不需要重启系统 2、可支持添加不同或自定义语言包（就是配置的资源文件） 参考： Nacos实现SpringBoot国际化的增强_spr…

阅读更多...

嵌入式代码升级——IAP

嵌入式代码升级——IAP

目录 IAP的特点实现 IAP 功能 STM32 正常的程序运行流程 STM32 加入IAP后的运行流程程序执行流程 BootLoader程序 APP1程序 APP2程序验证操作步骤 IAP（In-Application Programming）指的是在应用程序运行时对其自身的Flash存储器进行编程的操作…

阅读更多...

修复 Ubuntu 24.04 Dock 丢失应用程序图标

修复 Ubuntu 24.04 Dock 丢失应用程序图标

找出应用程序窗口的类名首先，您需要启动应用程序窗口。然后，按 Alt F2 启动“运行 Command”对话框。当对话框打开时，输入 lg 并按 Enter 键。在该窗口中，单击Windows按钮，然后找出目标应用程序窗口的类名称。在/…

阅读更多...

激光干涉仪可以完成哪些测量：全面应用解析

激光干涉仪可以完成哪些测量：全面应用解析

在高端制造领域，精度是衡量产品质量的关键指标之一。激光干涉仪作为一项高精度测量技术，其应用广泛，对于提升产品制造精度具有重要意义。线性测量：精确定位的基础激光干涉仪采用迈克尔逊干涉原理，实现线性测量。该…

阅读更多...

怎么转播别人的直播

怎么转播别人的直播

转播别人的直播，特别是实现无缝的实时转播，可以通过一些平台的功能来实现，比如快手和抖音。下面是一个基本的步骤说明，但请注意，具体操作可能会因平台更新或政策变化而有所不同： 找到想要转播的直播间&…

阅读更多...

推荐文章

最新文章