全量微调
部分参数微调
Adaper-Tuning
降维的意义
- 计算和存储成本
- 去除冗余和噪声—特定任务训练数据有限
- 减少模型复杂度避免过拟合风险
- 适应任务需求
过拟合
- 是指模型在训练数据上表现得很好,但在新的未见过的数据上表现较差的现象
- 模型过于复杂,训练数据量不足等因素引起的
LORA
1. 预训练一个大型语言模型,例如BERT或GPT-2。
2. 为特定的下游任务或领域创建一个小型的LoRA模块,该模块包括一个低秩矩阵A和一个低秩矩阵B。
3. 将预训练模型的权重与矩阵A和B相乘,得到一个适应于特定任务的模型。
4. 对适应后的模型进行微调,以进一步提高性能。