【文献阅读】AdaLora: Adaptive Budget Allocation for Parameter-Efficient Fine-Tuning

news2024/9/22 7:28:35

目录

  • 1. 前言
  • 2. 矩阵分解
    • 2.1 SVD分解
    • 2.2 特征值分解
    • 2.3 LU分解
    • 2.4 QR分解
  • 3. AdaLora
    • 3.1 motivation
    • 3.2 改进

1. 前言

矩阵分解为什么可以加速推理

假设原始权重矩阵 W ∈ R ( m ∗ n ) {W∈R^{(m*n)}} WR(mn),矩阵乘法中时间复杂度为mn,变形为 W = B A , B ∈ R ( m ∗ r ) , A ∈ R ( r ∗ n ) {W=BA, B∈R^{(m*r)}, A∈R{(r*n)}} W=BA,BR(mr),AR(rn),则时间复杂度变为mr+r*n

2. 矩阵分解

常见的矩阵分解方法有:奇异值分解(SVD),特征值分解(EVD),LU分解,QR分解

2.1 SVD分解

在这里插入图片描述
奇异矩阵是指不可逆矩阵,即行列式为0的矩阵。奇异矩阵的行或列向量之间是线性相关的,换句话说,它的行或列不能形成满秩(rank)矩阵。因此,奇异矩阵的秩小于它的维度。
奇异值描述了矩阵对向量的变换效果。奇异值总是非负的,矩阵的非零奇异值的数量等于矩阵的秩。即,奇异值为 0 的个数表示矩阵的线性依赖程度。

2.2 特征值分解

在这里插入图片描述
特征值分解只适用于方阵。

2.3 LU分解

在这里插入图片描述

2.4 QR分解

在这里插入图片描述

3. AdaLora

3.1 motivation

lora存在一些问题:

  • LoRA中所有适配器具有相同的秩(线性无关组的数量),忽略了在微调预训练模型时,权重矩阵的重要性在不同模块和层之间存在显著差异
  • 只训练了Attention,没有训练FFN,事实上FFN更重要。

Adalora通过lora矩阵的奇异值去衡量重要性

3.2 改进

  • 调整增量矩分配
    AdaLoRA将关键的增量矩阵分配高秩以捕捉更精细和任务特定的信息,而将较不重要的矩阵的秩降低,以防止过拟合并节省计算预算。
  • 以奇异值分解的形式对增量更新进行参数化,并根据重要性指标裁剪掉不重要的奇异值,同时保留奇异向量。
    由于对一个大矩阵进行精确SVD分解的计算消耗非常大,这种方法通过减少它们的参数预算来加速计算,同时,保留未来恢复的可能性并稳定训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2108079.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue.js 组件化开发:父子组件通信与组件注册详解

Vue.js 组件化开发:父子组件通信与组件注册详解 简介: 在 Vue.js 的开发中,组件是构建应用的重要基础。掌握组件的创建与使用,尤其是父子组件的通信和组件的注册与命名,是开发中不可或缺的技能。本文将详细探讨这些内容…

Day-04-QFile打开文件的两种方式

一、UI界面设置两个按键&#xff0c;并直接转到槽函数 二、两种代码展示 #include <QFile> #include <QDebug>//此两种方式中调用函数&#xff0c;应包含的头文件void Widget::on_btnReadFile01_clicked()//第一种打开方式 {//1. 打开文件QFile file;file.setFile…

双指针(3)_快慢指针_快乐数问题

个人主页&#xff1a;C忠实粉丝 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 C忠实粉丝 原创 双指针(3)_快慢指针_快乐数问题 收录于专栏【经典算法练习】 本专栏旨在分享学习C的一点学习笔记&#xff0c;欢迎大家在评论区交流讨论&#x1f48c; 目录 1.…

天润融通解开售后维修的成本枷锁,提高维修服务效率

如今&#xff0c;企业客户服务在开展业务咨询和售后受理时&#xff0c;主要方式还是通过电话与在线方式进行。这种方式虽然方便&#xff0c;但是对于一些非常紧急的情况还是显得有些不够。 比如&#xff0c;虽然现在许多企业APP已经实现了一键咨询和一键报修&#xff0c;但当客…

[Deepin] 简单使用 RustDesk 实现远程访问Deepin

本教程假设你学会了看官方文档&#xff0c;且拥有基本的IT常识 本教程仅提供可用的方法&#xff0c;并讲述局限性和更优但更复杂的方法&#xff0c;不是一个手把手教程 目标&#xff1a;实现远程访问Deepin 依托 樱花frpRustDesk的“允许通过ip访问” 概述 在RustDesk打开…

谷歌seo网址如何快速被收录?

想让你的网站快速被搜索引擎收录&#xff0c;可以采取几种不同的策略。首先&#xff0c;确保你的网站内容丰富、有价值&#xff0c;搜索引擎更喜欢收录内容质量高的网站。同时&#xff0c;增强网站的外链建设&#xff0c;做好这些站内优化&#xff0c;接下来就是通过谷歌搜索控…

AMV格式转换,试试这五种转换方式

AMV格式转换&#xff0c;AMV格式是一种专为MP4播放器而开发的视频格式&#xff0c;具有小巧、易于传输和较好的视频质量等特点。然而&#xff0c;AMV格式并不是普遍支持的格式&#xff0c;这导致了许多用户在使用MP4播放器时无法播放AMV格式的视频。为了帮助大家解决这一问题&a…

动态化-鸿蒙跨端方案介绍

一、背景 &#x1f449; 华为在2023.9.25官方发布会上宣布&#xff0c;新的鸿蒙系统将不再兼容安卓应用&#xff0c;这意味着&#xff0c;包括京东金融APP在内的所有安卓应用&#xff0c;在新的鸿蒙系统上将无法运行&#xff0c;需要重新开发专门适用于新鸿蒙系统的专版APP。 …

Java项目: 基于SpringBoot+mysql网上点餐系统分前后台(含源码+数据库+答辩PPT+毕业论文)

一、项目简介 本项目是一套基于SpringBootmysql网上点餐系统 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff0c;eclipse或者idea 确保可以运行&#xff01; 该系统功能完善、界面美观、操作简单、功能齐…

深度学习特征提取魔改版太强了!发文香饽饽!

要说CV领域经久不衰的研究热点&#xff0c;特征提取可以占一席&#xff0c;毕竟SLAM、三维重建等重要应用的底层都离不开它。 再加上近几年深度学习兴起&#xff0c;用深度学习做特征提取逐渐成了主流&#xff0c;比传统算法无论是性能、准确性还是效率都更胜一筹。 目前比较…

AAC高级音频编码技术

一、什么是AAC AAC的中文名称是高级音频编码技术&#xff0c;它是基于MPEG-2的一种全新的音频编码技术。随着时代的发展&#xff0c;目前AAC的技术升级到MPEG-4表准。AAC广泛的应用在网络传输、高清录制等领域&#xff0c;而AAC技术的出现就是为了取代之前的MP3格式。 二、为什…

类的加载过程与初始化小记

//部分内容来自“狂神说java” 代码验证 解释 1.加载类的信息&#xff0c;加载到内存中&#xff0c;如例子&#xff0c;将Test05和A类的信息加载到方法区&#xff0c; 2.加载完成后&#xff0c;立马生成一个class对象&#xff0c;如例 java.lang.class对象代表Test05类..., 3…

畅捷通ERP远程访问:使用巴比达内网穿透的体验

ERP系统的应用越来越普遍。畅捷通ERP作为一款优秀的企业资源管理工具&#xff0c;帮助企业整合资源&#xff0c;提高运营效率。然而&#xff0c;很多企业在使用畅捷通ERP时&#xff0c;面临着远程访问的问题。为了有效解决这一问题&#xff0c;我尝试了巴比达内网穿透&#xff…

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路+代码+数据教学

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路代码数据教学 C题题目&#xff1a;农作物的种植策略 今年的题目很有意思&#xff0c;和去年C题题目相关联了&#xff0c;接下来我们将按照题目总体分析-背景分析-各小问分析的形式来 1 总体分析 1.1 问题背景&…

[算法]单调栈解法

目录 739. 每日温度 - 力扣&#xff08;LeetCode&#xff09; 42. 接雨水 - 力扣&#xff08;LeetCode&#xff09; 84. 柱状图中最大的矩形 - 力扣&#xff08;LeetCode&#xff09; 739. 每日温度 - 力扣&#xff08;LeetCode&#xff09; 解法&#xff1a; 通常是一维数…

Ubuntu: 配置OpenCV环境

从从Ubuntu系统安装opencv_ubuntu安装opencv-CSDN博客文章浏览阅读2.3k次&#xff0c;点赞4次&#xff0c;收藏14次。开源计算机视觉(OpenCV)是一个主要针对实时计算机视觉的编程函数库。OpenCV的应用领域包括:2D和3D功能工具包、运动估计、面部识别系统、手势识别、人机交互、…

2024 高教社杯 数学建模国赛 (C题)深度剖析|农作物的种植策略|数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时&#xff0c;你是否曾经感到茫然无措&#xff1f;作为2022年美国大学生数学建模比赛的O奖得主&#xff0c;我为大家提供了一套优秀的解题思路&#xff0c;让你轻松应对各种难题&#xff01; CS团队倾注了大量时间和心血&#xff0c;深入挖掘解…

数学专题.

数论 1.判断质数 定义&#xff1a;在大于1的整数中&#xff0c;如果只包含1和本身这两个约数&#xff0c;就称为质数or素数 Acwing 866.试除法判断质数 2.预处理质数&#xff08;筛质数&#xff09; Acwing 868.筛质数 3.质因数分解 Acwing 867.分解质因数 4.阶乘分解 5.因…

2024最新软件测试面试题(附答案)来测试下你的水平

1、软件测试的目的是&#xff08; &#xff09; A、试验性运行软件 B、发现软件错误 C、证明软件正确 D、找出软件中全部错误 【答案】B 2、下面说法正确的是( ) A、经过测试没有发现错误说明程序正确 B、测试的目标是为了证明程序没有错误 C、成功的测试是发现了迄今…

数字货币是怎么回事什么是数字货币

数字货币的定义 数字货币是一种基于密码学原理的数字形式表示的货币&#xff0c;通过特定的加密算法和分布式账本技术实现安全交易和流通。它不像传统货币那样具有实体形态&#xff0c;而是以电子方式存在。数字货币可以通过互联网进行转账和交易&#xff0c;通常依赖区块链等分…