【文献阅读】AdaLora: Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

【文献阅读】AdaLora: Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

news2025/4/19 10:47:10

目录

1. 前言
2. 矩阵分解
- 2.1 SVD分解
- 2.2 特征值分解
- 2.3 LU分解
- 2.4 QR分解
3. AdaLora
- 3.1 motivation
- 3.2 改进

1. 前言

矩阵分解为什么可以加速推理

假设原始权重矩阵 ${W∈R^{(m*n)}}$ ，矩阵乘法中时间复杂度为mn，变形为 ${W=BA, B∈R^{(m*r)}, A∈R{(r*n)}}$ ，则时间复杂度变为mr+r*n

2. 矩阵分解

常见的矩阵分解方法有：奇异值分解（SVD），特征值分解（EVD）,LU分解，QR分解

2.1 SVD分解

在这里插入图片描述
奇异矩阵是指不可逆矩阵，即行列式为0的矩阵。奇异矩阵的行或列向量之间是线性相关的，换句话说，它的行或列不能形成满秩（rank）矩阵。因此，奇异矩阵的秩小于它的维度。
奇异值描述了矩阵对向量的变换效果。奇异值总是非负的，矩阵的非零奇异值的数量等于矩阵的秩。即，奇异值为 0 的个数表示矩阵的线性依赖程度。

2.2 特征值分解

在这里插入图片描述
特征值分解只适用于方阵。

2.3 LU分解

在这里插入图片描述

2.4 QR分解

在这里插入图片描述

3. AdaLora

3.1 motivation

lora存在一些问题：

LoRA中所有适配器具有相同的秩（线性无关组的数量），忽略了在微调预训练模型时，权重矩阵的重要性在不同模块和层之间存在显著差异
只训练了Attention，没有训练FFN，事实上FFN更重要。

Adalora通过lora矩阵的奇异值去衡量重要性

3.2 改进

调整增量矩分配
AdaLoRA将关键的增量矩阵分配高秩以捕捉更精细和任务特定的信息，而将较不重要的矩阵的秩降低，以防止过拟合并节省计算预算。
以奇异值分解的形式对增量更新进行参数化，并根据重要性指标裁剪掉不重要的奇异值，同时保留奇异向量。
由于对一个大矩阵进行精确SVD分解的计算消耗非常大，这种方法通过减少它们的参数预算来加速计算，同时，保留未来恢复的可能性并稳定训练。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2108079.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Vue.js 组件化开发：父子组件通信与组件注册详解

Vue.js 组件化开发：父子组件通信与组件注册详解

Vue.js 组件化开发：父子组件通信与组件注册详解简介： 在 Vue.js 的开发中，组件是构建应用的重要基础。掌握组件的创建与使用，尤其是父子组件的通信和组件的注册与命名，是开发中不可或缺的技能。本文将详细探讨这些内容…

阅读更多...

Day-04-QFile打开文件的两种方式

Day-04-QFile打开文件的两种方式

一、UI界面设置两个按键，并直接转到槽函数二、两种代码展示 #include <QFile> #include <QDebug>//此两种方式中调用函数，应包含的头文件void Widget::on_btnReadFile01_clicked()//第一种打开方式 {//1. 打开文件QFile file;file.setFile…

阅读更多...

双指针(3)_快慢指针_快乐数问题

双指针(3)_快慢指针_快乐数问题

个人主页：C忠实粉丝欢迎点赞👍 收藏✨ 留言✉ 加关注💓本文由 C忠实粉丝原创双指针(3)_快慢指针_快乐数问题收录于专栏【经典算法练习】本专栏旨在分享学习C的一点学习笔记，欢迎大家在评论区交流讨论💌 目录 1.…

阅读更多...

天润融通解开售后维修的成本枷锁，提高维修服务效率

天润融通解开售后维修的成本枷锁，提高维修服务效率

如今，企业客户服务在开展业务咨询和售后受理时，主要方式还是通过电话与在线方式进行。这种方式虽然方便，但是对于一些非常紧急的情况还是显得有些不够。比如，虽然现在许多企业APP已经实现了一键咨询和一键报修，但当客…

阅读更多...

[Deepin] 简单使用 RustDesk 实现远程访问Deepin

[Deepin] 简单使用 RustDesk 实现远程访问Deepin

本教程假设你学会了看官方文档，且拥有基本的IT常识本教程仅提供可用的方法，并讲述局限性和更优但更复杂的方法，不是一个手把手教程目标：实现远程访问Deepin 依托樱花frpRustDesk的“允许通过ip访问” 概述在RustDesk打开…

阅读更多...

谷歌seo网址如何快速被收录？

谷歌seo网址如何快速被收录？

想让你的网站快速被搜索引擎收录，可以采取几种不同的策略。首先，确保你的网站内容丰富、有价值，搜索引擎更喜欢收录内容质量高的网站。同时，增强网站的外链建设，做好这些站内优化，接下来就是通过谷歌搜索控…

阅读更多...

AMV格式转换，试试这五种转换方式

AMV格式转换，试试这五种转换方式

AMV格式转换，AMV格式是一种专为MP4播放器而开发的视频格式，具有小巧、易于传输和较好的视频质量等特点。然而，AMV格式并不是普遍支持的格式，这导致了许多用户在使用MP4播放器时无法播放AMV格式的视频。为了帮助大家解决这一问题&a…

阅读更多...

动态化-鸿蒙跨端方案介绍

动态化-鸿蒙跨端方案介绍

一、背景 👉 华为在2023.9.25官方发布会上宣布，新的鸿蒙系统将不再兼容安卓应用，这意味着，包括京东金融APP在内的所有安卓应用，在新的鸿蒙系统上将无法运行，需要重新开发专门适用于新鸿蒙系统的专版APP。 …

阅读更多...

Java项目: 基于SpringBoot+mysql网上点餐系统分前后台(含源码+数据库+答辩PPT+毕业论文)

Java项目: 基于SpringBoot+mysql网上点餐系统分前后台(含源码+数据库+答辩PPT+毕业论文)

一、项目简介本项目是一套基于SpringBootmysql网上点餐系统包含：项目源码、数据库脚本等，该项目附带全部源码可作为毕设使用。项目都经过严格调试，eclipse或者idea 确保可以运行！ 该系统功能完善、界面美观、操作简单、功能齐…

阅读更多...

深度学习特征提取魔改版太强了！发文香饽饽！

深度学习特征提取魔改版太强了！发文香饽饽！

要说CV领域经久不衰的研究热点，特征提取可以占一席，毕竟SLAM、三维重建等重要应用的底层都离不开它。再加上近几年深度学习兴起，用深度学习做特征提取逐渐成了主流，比传统算法无论是性能、准确性还是效率都更胜一筹。目前比较…

阅读更多...

AAC高级音频编码技术

AAC高级音频编码技术

一、什么是AAC AAC的中文名称是高级音频编码技术，它是基于MPEG-2的一种全新的音频编码技术。随着时代的发展，目前AAC的技术升级到MPEG-4表准。AAC广泛的应用在网络传输、高清录制等领域，而AAC技术的出现就是为了取代之前的MP3格式。二、为什…

阅读更多...

类的加载过程与初始化小记

类的加载过程与初始化小记

//部分内容来自“狂神说java” 代码验证解释 1.加载类的信息，加载到内存中，如例子，将Test05和A类的信息加载到方法区， 2.加载完成后，立马生成一个class对象，如例 java.lang.class对象代表Test05类..., 3…

阅读更多...

畅捷通ERP远程访问：使用巴比达内网穿透的体验

畅捷通ERP远程访问：使用巴比达内网穿透的体验

ERP系统的应用越来越普遍。畅捷通ERP作为一款优秀的企业资源管理工具，帮助企业整合资源，提高运营效率。然而，很多企业在使用畅捷通ERP时，面临着远程访问的问题。为了有效解决这一问题，我尝试了巴比达内网穿透&#xff…

阅读更多...

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路+代码+数据教学

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路+代码+数据教学

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路代码数据教学 C题题目：农作物的种植策略今年的题目很有意思，和去年C题题目相关联了，接下来我们将按照题目总体分析-背景分析-各小问分析的形式来 1 总体分析 1.1 问题背景&…

阅读更多...

[算法]单调栈解法

[算法]单调栈解法

目录 739. 每日温度 - 力扣（LeetCode） 42. 接雨水 - 力扣（LeetCode） 84. 柱状图中最大的矩形 - 力扣（LeetCode） 739. 每日温度 - 力扣（LeetCode） 解法： 通常是一维数…

阅读更多...

Ubuntu: 配置OpenCV环境

从从Ubuntu系统安装opencv_ubuntu安装opencv-CSDN博客文章浏览阅读2.3k次，点赞4次，收藏14次。开源计算机视觉(OpenCV)是一个主要针对实时计算机视觉的编程函数库。OpenCV的应用领域包括:2D和3D功能工具包、运动估计、面部识别系统、手势识别、人机交互、…

阅读更多...

2024 高教社杯数学建模国赛（C题）深度剖析|农作物的种植策略|数学建模完整代码+建模过程全解全析

2024 高教社杯数学建模国赛（C题）深度剖析|农作物的种植策略|数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时，你是否曾经感到茫然无措？作为2022年美国大学生数学建模比赛的O奖得主，我为大家提供了一套优秀的解题思路，让你轻松应对各种难题！ CS团队倾注了大量时间和心血，深入挖掘解…

阅读更多...

数学专题.

数学专题.

数论 1.判断质数定义：在大于1的整数中，如果只包含1和本身这两个约数，就称为质数or素数 Acwing 866.试除法判断质数 2.预处理质数（筛质数） Acwing 868.筛质数 3.质因数分解 Acwing 867.分解质因数 4.阶乘分解 5.因…

阅读更多...

2024最新软件测试面试题（附答案）来测试下你的水平

2024最新软件测试面试题（附答案）来测试下你的水平

1、软件测试的目的是（ ） A、试验性运行软件 B、发现软件错误 C、证明软件正确 D、找出软件中全部错误【答案】B 2、下面说法正确的是( ) A、经过测试没有发现错误说明程序正确 B、测试的目标是为了证明程序没有错误 C、成功的测试是发现了迄今…

阅读更多...

数字货币是怎么回事什么是数字货币

数字货币是怎么回事什么是数字货币

数字货币的定义数字货币是一种基于密码学原理的数字形式表示的货币，通过特定的加密算法和分布式账本技术实现安全交易和流通。它不像传统货币那样具有实体形态，而是以电子方式存在。数字货币可以通过互联网进行转账和交易，通常依赖区块链等分…

阅读更多...

推荐文章

最新文章