全网最最实用--边缘智能的常见微调方式以及适用场景

news2024/11/24 4:19:28

文章目录

  • 1. BitFit
  • 2. Adapter
  • 3. Prompt-Tuning
  • 4. Prefix-Tuning
  • 5. LoRA (Low-Rank Adaptation)
  • 6. QLoRA (Quantized Low-Rank Adaptation)
  • 7. LongLoRA
  • 总结

1. BitFit

https://arxiv.org/abs/2106.10199
主要做法

  • BitFit(Bias Term Fine-Tuning)是一种只微调模型偏置项的方法。
  • 在微调过程中,只更新模型的偏置项(bias term),保持权重矩阵(weights)不变。

优点

  • 低计算成本:只更新偏置项,相比全面微调整个模型,计算成本和内存需求大幅降低。
  • 高效性:由于参数更新数量少,训练速度较快。

缺点

  • 有限的表达能力:只更新偏置项可能无法捕捉复杂的任务特性,适应性有限。

适用场景

  • 资源受限场景:计算资源和内存有限的情况下,在数据规模较少时候,仅微调偏差有优势。
  • 任务简单场景:模型只需进行微小调整即可完成任务。

2. Adapter

https://arxiv.org/abs/2009.09139
主要做法

  • 在预训练模型的每一层中插入小型的适配器模块(adapter module)。
  • 只微调这些适配器模块的参数,保持原始模型参数不变。

优点

  • 模块化:易于在不同任务之间共享并切换适配器模块。
  • 节省存储:不需要存储整个模型的多个版本,只需存储适配器参数。

缺点

  • 额外计算开销:插入适配器模块会增加计算复杂度,增加推理开销(尤其是在批量大小较小而且序列长度较短的情况下)。
  • 需要设计:适配器模块的设计和插入位置需要仔细策划。

适用场景

  • 多任务学习:在不同任务之间共享同一基础模型。
  • 可扩展性需求:希望在一个模型基础上方便地扩展到多个任务。

3. Prompt-Tuning

https://arxiv.org/pdf/2104.08691

主要做法

  • 为输入添加可学习的提示词(prompt),使得模型能够更好地理解任务。
  • 只微调这些提示词的参数,而保持其他模型参数不变。

优点

  • 参数高效:只增加少量参数用于提示词,节省了存储和计算资源。模型参数足够大时准确度媲美模型微调。
  • 灵活性:可以通过调整提示词来适应不同任务。

缺点

  • 任务依赖性强:提示词的效果可能强烈依赖于任务的具体细节。占用可用的输入长度。
  • 复杂性:设计和选择合适的提示词可能需要试验和调优。

适用场景

  • 自然语言处理任务:如文本分类、问答、文本生成等。
  • 快速原型开发:快速测试和验证新任务或新数据集。

4. Prefix-Tuning

https://arxiv.org/abs/2101.00190
主要做法

  • 在输入序列的前面每一层前面添加可学习的前缀(prefix)。
  • 只微调这些前缀的参数,不改变模型的其他部分。

优点

  • 参数高效:类似于Prompt-Tuning,参数开销较小。
  • 任务适应性强:通过前缀调整模型以适应特定任务。

缺点

  • 任务依赖性强:前缀的设计可能需要根据任务进行调整。每层token更长,计算量更大,存在推理延迟。
  • 复杂性:选择和微调前缀可能需要大量实验。

适用场景

  • 文本生成任务:如机器翻译、文本摘要。
  • 逐步引导模型:通过前缀逐步引导模型输出特定类型的结果。

5. LoRA (Low-Rank Adaptation)

在这里插入图片描述

https://arxiv.org/abs/2106.09685
主要做法

  • 引入并行、可融合且可学习的分支:在模型的每一层中添加低秩矩阵分解(low-rank decomposition)。
  • 通过低秩矩阵的微调来实现模型的调整,而不是直接调整原始参数。

优点

  • 参数高效:低秩矩阵减少了参数数量,节省了存储和计算资源。
  • 表达能力强:相比于只调整偏置项,低秩矩阵可以捕捉更多复杂的特性。

缺点

  • 设计复杂性:低秩矩阵的选择和分解需要精心设计。
  • 额外计算开销:尽管参数减少,但低秩分解的计算也增加了一定的复杂度。

适用场景

  • 中大型模型微调:需要在保持性能的同时减少微调参数的情况。
  • 资源受限场景:希望在有限资源下实现高效微调。

6. QLoRA (Quantized Low-Rank Adaptation)

https://arxiv.org/abs/2309.14717
主要做法

  • 基于LoRA方法,将低秩矩阵进行量化处理(不使用16位的transformer为主干,将主干网络量化仅为4位NF4)。
  • 利用MP6C对LoRa分支进行微调

优点

  • 存储和计算资源极度优化:通过量化进一步减少参数和计算需求。
  • 保持性能:在某些任务中,量化处理可以在不显著损失性能的情况下实现高效微调。

缺点

  • 量化误差:量化处理可能引入误差,影响模型的精度。
  • 设计复杂性:需要对量化方法进行仔细设计和验证。

适用场景

  • 超大模型微调:在超大模型上进行微调,同时需要极大地减少计算和存储需求。
  • 边缘计算:在资源非常有限的边缘设备上运行大模型。

7. LongLoRA

https://arxiv.org/abs/2402.10171
主要做法

  • 基于LoRA进行扩展上下文,专门优化长序列处理。
  • 通过平移稀疏注意力(注意力分组计算且每组移动一半)和增强LoRA(还得微调输入嵌入层和正则化层)

优点

  • 处理长序列优化:专门针对长序列问题进行优化,性能更好。
  • 参数高效:保持LoRA的低参数量特性,适合长序列任务。

缺点

  • 设计复杂性:需要专门设计和验证长序列处理方法。
  • 适用性有限:主要针对长序列任务,其他任务可能不适用。

适用场景

  • 长文本处理:如长文档摘要、长文本生成、长序列分析。
  • 需要长依赖的任务:任何需要处理长依赖的自然语言处理任务。

总结

每种微调方法都有其独特的优缺点和适用场景:

  • BitFit:适用于资源受限和简单任务,计算成本低但适应性有限。
  • Adapter:适用于多任务学习和可扩展性需求,模块化设计节省存储,但增加计算开销。
  • Prompt-Tuning:适用于快速原型开发和灵活任务调整,参数开销低但任务依赖性强。
  • Prefix-Tuning:适用于文本生成和逐步引导任务,参数高效但需要设计和调优。
  • LoRA:适用于中大型模型和资源受限场景,参数高效且表达能力强,但设计复杂。
  • QLoRA:适用于超大模型和边缘计算,存储和计算资源优化,但可能引入量化误差。
  • LongLoRA:适用于需要处理长序列依赖的任务,参数高效但设计复杂。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1986596.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

日撸Java三百行(day15:栈的应用之括号匹配)

目录 一、栈的括号匹配 二、代码实现 1.方法创建 2.数据测试 3.完整的程序代码 总结 一、栈的括号匹配 要完成今天的任务,需要先来了解一下什么是栈的括号匹配。首先,顾名思义,括号匹配就是指将一对括号匹配起来,我们给定一…

HashTable源码

引子 看到一个关于HashMap和HashTable对比的面试题,于是简单看了下HashTable的源码,简单记录下。 概述 与HashMap相似的哈希表结构,有很多不同点: 节点数组的初始化是在构造函数中完成的,初始容量11,负载因…

基于JSP、java、Tomcat三者的项目实战--校园交易网(3)主页--历史清单

技术支持:JAVA、JSP 服务器:TOMCAT 7.0.86 编程软件:IntelliJ IDEA 2021.1.3 x64 前文几个功能的实现的博客 基于JSP、java、Tomcat、mysql三层交互的项目实战--校园交易网(1)-项目搭建(前期准备工作&a…

工具学习_CVE Binary Tool

1. 工具概述 CVE Binary Tool 是一个免费的开源工具,可帮助您使用国家漏洞数据库(NVD)常见漏洞和暴露(CVE)列表中的数据以及Redhat、开源漏洞数据库(OSV)、Gitlab咨询数据库(GAD&am…

鸿蒙AI功能开发【人脸活体验证控件】 机器学习-场景化视觉服务

人脸活体验证控件 介绍 本示例展示了使用视觉类AI能力中的人脸活体验证能力。 本示例模拟了在应用里,跳转人脸活体验证控件,获取到验证结果并展示出来。 需要使用hiai引擎框架人脸活体验证接口kit.VisionKit.d.ts。 效果预览 使用说明: …

RK3568平台开发系列讲解(文件系统篇)文件描述符 fd(File Descriptor)是什么?

📢USB控制传输是USB通信中的一种基本传输类型,用于控制USB设备的配置和操作。它由 Setup 阶段和 Data 阶段组成,可用于发送命令、读取状态、配置设备等操作。 一、文件描述符 fd(File Descriptor)是什么? 文件描述符 fd 是一个非负整数,用来标识一个打开的文件,由内核…

用户态tcp协议栈四次挥手-服务端发送fin时,客户端不返回ac

问题: 四次挥手时,服务端发送fin后,客户端不发送ack,反而过了2min后发了个rst报文 62505是客户端,8889是服务端 解决: 服务端返回fin报文时带上ack标记

微波武器反无人机技术详解

微波武器反无人机技术中展现出了独特的优势和广阔的应用前景。以下是对微波武器在反无人机技术方面的详细解析: 一、微波武器概述 微波武器是指配备高功率微波(High-Power Microwave, HPM)载荷的作战武器,能够发射高能量的电磁脉…

在AI浪潮中保持核心竞争力:XIAOJUSURVEY的智能化探索

讲点实在的 在AI技术快速发展的今天,各行各业的工作方式正经历深刻变革。尤其是身处浪潮中甚至最有机会推动发展的我们,更需要置身事内。 ChatGPT、Copilot等的普及,使得编程效率显著提升,但也带来了新的挑战。为了在这种变革中…

C++输出为非科学计数法不同数据类型表示范围

目录 一、C数据类型 1、基本的内置类型 2、修饰符 (1)signed 和 unsigned (2)short 和 long (3)区别总结 默认情况 二、类型转换 1、静态转换(Static Cast) 2、动态转换&a…

C语言——函数(1)

函数 定义: 函数就是用来完成一定功能的一段代码(程序)模块。 在设计较大的程序时,一般将其分为若干个程序模块,每个模块用来实现一定的功能。 函数优势: 我们可以通过函数提供功能给别人使用&#xff0c…

美国商超入驻Homedepot,传统家织厂家跨境赛道新选择?——WAYLI威利跨境助力商家

美国商超入驻Homedepot为传统家织厂家提供了新跨境选择。据《Interactive Home Shopping》一文,电子购物让消费者更易定位和比较产品。传统家织厂家可通过Homedepot等大型零售商,利用其平台优势,接触更广泛消费者。 根据《Homedepot之争——家…

【八股文】Redis

1.Redis有哪些数据类型 常用的数据类型,String,List,Set,Hash和ZSet(有序) String:Session,Token,序列化后的对象存储,BitMap也是用的String类型,…

案例:LVS+Keepalived集群

目录 Keepalived 原理 Keepalived案例 双机高可用热备案例 配置 修改配置文件 测试 严格模式测试 修改配置文件 测试 模拟故障测试 LVSKeepalived高可用 案例拓扑图 初步配置 关闭服务 主调度器配置 健康状态检查的方式 调整内核参数 从调度器配置 服务器池…

失业后才会明白,职场上有4个扎心的现象

最近一段时间,因为疫情的原因,很多企业都在经历着前所未有的困难,其中就包括华为这样的大型企业。 任正非在接受媒体采访的时候表示:“全球经济持续衰退,未来3到5年内都不可能转好……把寒气传递给每个人。 这句话一…

python中的魔术方法(特殊方法)

文章目录 1. 前言2. __init__方法3. __new__方法4. __call__方法5. __str__方法6. __repr__方法7. __getitem__方法8. __setitem__方法9. __delitem__方法10. __len__方法11. 富比较特殊方法12. __iter__方法和__next__方法13. __getattr__方法、__setattr__方法、__delattr__方…

深度学习DeepLearning Inference 学习笔记

神经网络预测 术语 隐藏层神经元多层感知器 神经网络概述 应当选择正确的隐藏层数和每层隐藏神经元的数量,以达到这一层的输出是下一层的输入,逐层变得清晰,最终输出数据的目的。 在人脸识别的应用中,我们将图片视作连续的像…

【Java 第九篇章】多线程实际工作中的头大的模块

多线程是一种编程概念,它允许多个执行路径(线程)在同一进程内并发运行。 一、多线程的概念和作用 1、概念 线程是程序执行的最小单元,一个进程可以包含多个线程。每个线程都有自己的程序计数器、栈和局部变量,但它们…

Motionface ai工具有哪些?

Motionface Android/PC 用一张静态含有人脸相片来生成一个能说会唱的虚拟主播。使用简单便捷,极致的流畅度体验超乎您的想象。 免费下载 Respeak PC电脑软件 任意视频一键生成虚拟主播,匹配音频嘴型同步,保留原视频人物神态和动作&#xff0c…

核显硬刚RTX 4070,AMD全新APU杀疯了

这年头,一台平民玩家低预算主流桌面电脑主机是什么配置? Intel i5 12400F CPU、B760 主板、NVIDIA RTX 4060 显卡、双 8G DDR4 内存、1T 固态硬盘的组合,想必相当具有代表性了吧! 但仔细掰开后我们不难发现,这套不到…