4、XTuner 微调个人小助手（笔记）

4、XTuner 微调个人小助手（笔记）

news2026/2/12 12:57:40

视频地址： https://b23.tv/QUhT6ni
课程文档：https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md
作业文档：https://github.com/InternLM/Tutorial/blob/camp2/xtuner/homework.md

1、Finetune 简介

两种Finetune范式
        LLM 的下游应用中，增量预训练和指令跟随是经常会用到两种的微调模式
增量预训练微调
        使用场景:让基座模型学习到一些新知识，如某个垂类领域的常识训练数据:文章、书籍、代码等；
指令跟随微调
        使用场景:让模型学会对话模板，根据人类指令进行对话训练数据:高质量的对话、问答数据；

LoRA：Low-RANK Adaptation of large language models

2、XTuner 介绍

3、8GB显存玩转LLM

http://t.csdnimg.cn/Z2bRl

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1597905.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

LeetCode_丑数

LeetCode_丑数

题目： 题解： 由题，我们知道丑数大于0，丑数都可以写成2*2*...*2*3*3...*3*5*5...*5，有了这个基础就很好写代码了。用三个while循环将前面的2 3 5全部除掉如果这个数是丑数，最后n是等于1的，反之…

阅读更多...

Leetcode-48-旋转图像

Leetcode-48-旋转图像

题目说明给定一个 n n 的二维矩阵表示一个图像。将图像顺时针旋转 90 度。说明：你必须在原地旋转图像，这意味着你需要直接修改输入的二维矩阵。请不要使用另一个矩阵来旋转图像。示例 1: 给定 matrix [ [1,2,3], [4,5,6], [7,8,9] ], 原地旋转输入…

阅读更多...

代码随想录阅读笔记-回溯【全排列】

代码随想录阅读笔记-回溯【全排列】

题目给定一个没有重复数字的序列，返回其所有可能的全排列。示例输入: [1,2,3]输出: [ [1,2,3], [1,3,2], [2,1,3], [2,3,1], [3,1,2], [3,2,1] ] 思路以[1,2,3]为例，抽象成树形结构如下： 回溯三部曲 1、递归函数参数首先排列是有…

阅读更多...

机器学习和深度学习-- 李宏毅（笔记与个人理解）Day 14

机器学习和深度学习-- 李宏毅（笔记与个人理解）Day 14

Day 14 Classfication (short version) 二分类的时候用sigmoid 那不就是 logistic 回归嘛（softmax 的二分类等价） Loss 哦今天刚学的 ，KL散度 ，看来cross-entropy 和KL散度是等价的咯~ 我感觉我的直觉没错这里MSE离得很远的时候…

阅读更多...

五、书架开发--5.书架分组功能开发

五、书架开发--5.书架分组功能开发

Dialog和ShelfGroupDialog的基本实现思路： 加入两个组件，一个是Dialog移出分组的弹窗，一个是ShelfGroupDialog，一个是create-api中加入这个ShelfGroupDialog 接下来我们看看这个移动书籍这个对话框的实现原理如下，用…

阅读更多...

Python 标准库functools高阶函数用法

Python 标准库functools高阶函数用法

目录 1. partial 用法示例 2. reduce 用法示例 3. total_ordering 用法示例 4. cmp_to_key 用法示例 5. lru_cache 用法示例 6. singledispatch 用法示例 7. update_wrapper 用法示例 8. partialmethod 用法示例 9. singledispatchmethod 用法示例 10. cache 用法示例…

阅读更多...

HoloLens2开发时，VS2022的组件和模块配置

HoloLens2开发时，VS2022的组件和模块配置

HoloLens2开发的时候，VS2022的安装和配置清单（有的模块可能不是必须的模块） 一、大的模块配置二、各模块组件的配置

阅读更多...

详解运算符重载——探索运算符重载的应用

详解运算符重载——探索运算符重载的应用

前言:运算符重载是面向对象的一个重要的知识点。我们都知道内置类型可以进行一般的运算符的运算。但是如果是一个自定义类型， 这些运算符就无法使用了。那么为了解决这个问题， 我们的祖师爷就在c中添加了运算符重载的概念。本篇主要通过实例——日期类的…

阅读更多...

Emacs之增加/取消输入括号自动匹配(一百三十六)

Emacs之增加/取消输入括号自动匹配(一百三十六)

简介： CSDN博客专家，专注Android/Linux系统，分享多mic语音方案、音视频、编解码等技术，与大家一起成长！ 优质专栏：Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏：多媒…

阅读更多...

安卓apk文件签名

安卓apk文件签名

一、环境准备链接: https://pan.baidu.com/s/1D3WxIL5M5ewyFNTqJzARPw 提取码: pd6w 上篇博文编译的apk文件 1、docker build -t android-build:v1.0.1 . 直接制作镜像 2、docker run -it android-build:v1.0.1 /bin/bash 运行进入容器指定sdk的路径，然后直接…

阅读更多...

AI - 提示词意外收获 (5)

AI - 提示词意外收获 (5)

提示词： A soft pink rose with opalescent leaves, located in a surreal desert under the light of a binary star system, The dual shadows and contrasting lights create a dreamlike quality, emphasizing the roses unique beauty,翻译: 一种柔软的粉红…

阅读更多...

RESA 车道线检测模型-debug分析

RESA 车道线检测模型-debug分析

车道线检测模型 RESA 该模型只有一个关键点就是resa模块，把这个想清楚就没什么了，下面看代码 class RESA(nn.Module):def __init__(self, cfg):super(RESA, self).__init__()# self.iter cfg.resa.iter# chan cfg.resa.input_channel# fea_stride c…

阅读更多...

绝地求生：PUBG七周年：杜卡迪联动即将到来！

绝地求生：PUBG七周年：杜卡迪联动即将到来！

4.13号PUBG官博放出来一个图片让大家猜测是什么东西。结合之前绝地求生的官方的公告，该载具皮肤毫无疑问就是著名摩托车品牌：杜卡迪。这篇文章就来简单分析一下本次即将到来的摩托车联动的具体细节。品牌介绍杜卡迪（Ducati Motor &…

阅读更多...

【测试开发学习历程】python常用的模块（中）

【测试开发学习历程】python常用的模块（中）

目录 5 time模块 5.1、Python中的四种格式的时间： 5.2、time模块中的常用函数 6 I/O流操作 6.1 创建文件 6.2 读取一个文件存入到另外一个文件 6.3 with open as 结构 6.4 open和with open as的区别 7 Excel的操作模块-openpyxl 7.1、新建Excel文件进行读…

阅读更多...

PTA 编程题（C语言）-- 判断素数

PTA 编程题（C语言）-- 判断素数

题目标题： 判断素数题目作者陈越浙江大学本题的目标很简单，就是判断一个给定的正整数是否素数。输入格式： 输入在第一行给出一个正整数N（≤ 10），随后N行，每行给出一个小于…

阅读更多...

渗透测试实战——第一站

渗透测试实战——第一站

仅供交流学习使用，请勿用于非法用途前言：刚学了sql注入，只听理论总感觉没啥用，今天花了一半个多小时，去尝试寻找有漏洞的网站，最终找到了一个；实践是检验真理的唯一标准。我是通过黑客常用语法…

阅读更多...

网络基础先导

网络基础先导

前言：最好在牢固前面几大件（编程语言、数据结构、操作系统），并且您有一个服务器的基础上（我使用的是腾讯云中配置最低的服务器）再来学习本系列的网络知识。 1.网络发展简要下面就是简单提及一些概念而已&…

阅读更多...

Shortened LLaMA：针对大语言模型的简单深度剪枝法

Shortened LLaMA：针对大语言模型的简单深度剪枝法

🍉 CSDN 叶庭云：https://yetingyun.blog.csdn.net/ 论文标题 & 发表会议：Shortened LLaMA: A Simple Depth Pruning for Large Language Models（ICLR 2024 Workshop） 论文地址：https://arxiv.org/abs/…

阅读更多...

绝地求生：PWS韩国联赛结束：KDF夺冠，DNW三年来首次错失世界赛

绝地求生：PWS韩国联赛结束：KDF夺冠，DNW三年来首次错失世界赛

4.14号PWS韩国联赛结束了为期3天的决赛，KDF战队以73击杀117分获PWS第一阶段冠军，队内Heaven获MVP，DK_seoul伤害王。常规赛靠前的DNW和Gen.G决赛均发挥失常都没有进入前八，其中上届世界冠军DNW在双S核心出走后时隔三年首次错失世界…

阅读更多...

OpenHarmony轻量系统开发【4】编写第一个程序、启动流程分析

OpenHarmony轻量系统开发【4】编写第一个程序、启动流程分析

摘要：本文简单介绍如何编写第一个hello world程序，以及程序是被执行的适合群体：适用于Hi3861开发板，启动流程分析 4.1编写第一个程序编写一个hello world程序比较简单，可以参考官网： https://gitee.c…

阅读更多...

推荐文章

最新文章