不会大模型不要紧!只需5分钟!你也可以微调大模型!如何快速微调Llama3.1-8B

news2025/1/11 23:59:51

AI浪潮席卷全球并发展至今已有近2年的时间了,大模型技术作为AI发展的底座和基石,更是作为AI从业者必须掌握的技能。但是作为非技术人员,相信大家也有一颗想要训练或微调一个大模型的心,但是苦于技术门槛太高,无从下手。今天教大家一个非常快速的方法,5分钟就可以让你快速上手去微调一个大模型。还不赶紧去试试!

什么是模型微调?

大模型微调(Fine-tuning)是指在已经预训练好的大型深度学习模型基础上,使用新的、特定任务相关的数据集对模型进行进一步训练的过程。这里我们用的微调方式选择的是Lora。

首先,我们是要基于一个开源的大模型去微调一个属于我们自己模型,所以我们要先找一个开源的大模型。而开源大模型社区,现在最火的一定是Hugging Face。但是苦于需要魔法上网,所以我们用国内的知名模型库魔搭社区。

网址:

https://www.modelscope.cn/models

比如我们接下来要演示的是近期刚发布的Meta Llama3.1-8B的一个大模型。

模型地址:

https://www.modelscope.cn/models/LLM-Research/Meta-Llama-3.1-8B-Instruct

如何快速微调一个模型呢,下载提供好的训练模型代码后,只需要准备训练数据集和修改你要训练的模型即可,是不是特别快,特别方便。

1、下载训练模型的代码

我已经整理好了,在公众号回复【Ft-models】即可获取。解压后目录如下:

(解压后)

train.py:要训练的脚本。

test.py:训练后用于测试的脚本。

chat.py:基于streamlit的简单web问答交互页面。

requirements.txt:运行时需要的python库文件。

dataset:存放要训练的数据。

models:存放模型(默认为空,启动train.py进行训练时会下载模型到该目录)

2、准备数据集

需要准备要训练的数据集,json格式的,为了训练快速,我只象征性的加了3条。后续大家根据自己需求添加即可。

(准备json格式数据集)

3、修改训练脚本(train.py) & 训练

修改训练脚本中的模型,这里选用的Llama-3.1-8B,想微调其他的模型,在魔搭社区查找完修改即可。

(修改要训练的模型名称)

修改训练的设备,因为我是mac,所以写死了用mps,大家如果用gpu训练的话,改成cuda(在此之前电脑别忘了安装驱动,但先要确认NVIDIA版本是否支持CUDA),否则值设成用cpu进行训练。

总结一下,这里的可选值有三个:mps、cuda、cpu。

(修改要训练的硬件用什么)

到这里就可以执行【train.py】进行训练了,训练的过程第一次会很慢,因为需要在线下载模型和训练代码依赖的python库。后续再次进行训练就很快了,后续的训练速度取决于你训练数据集的大小和电脑硬件的配置,用GPU肯定比CPU快多了。

训练前需要安装python环境,然后执行下面命令进行训练:

python3 train.py

(模型训练)

注意:因为我准备的训练数据只有三条,很少,只用于测试,为了训练结果更精确,所以训练的总轮数(num_train_epochs这个参数)我设定为了30,大家如果后续使用时,这个参数根据需要可以调整。

4、训练后测试

训练后的模型如何加载和使用呢?这里提供了两种方式,第一种是写了一个【test.py】的python脚本去调用。第二种是通过【chat.py】去调用,里面封装了用streamlit写的web页面。

第一种方式【test.py】:

和上面一样,打开【test.py】,需要修改要加载的模型和运行的硬件(可选值有mps、cuda、cpu)不多说了。

(修改要加载的模型名称)

(修改要推理的硬件)

运行下面代码进行第一种方式运行【test.py】进行测试:

python3 test.py

为了能看出来我们微调后模型是否有有效果,所以在训练前,我截了一个训练前的效果图。

微调训练前回答效果:

(微调前回答效果)

当我问:【什么是大模型?】

给我的回答是:【大模型(Large Model)指的是在机器学习和深度学习领域中,训练和应用的模型规模非常庞大和复杂的模型。这些模型通常由大量参数组成,能处理和学习复杂的数据模式和关系】

完全基于之前大模型自身的能力进行回答,解释了什么是大模型。

微调训练后回答效果:

(微调后回答效果)

当我问:【什么是大模型?】

给我的回答是:【LLM(Large Language Model),一般指万万级参数以上的模型,但是这个标准一直在升级,目前万亿参数以上的模型也有了。一般万万级参数以上的模型万亿参数以下的模型也有,但是这个标准一直在升级升级。】

这次回答是基于我们微调后进行回答的**,因为在数据集中我们进行了定义。所以微调是成功的**。(代码中现在把输出的max_new_tokens设定为定值100,所以会输出的结果有重复的情况)

第二种方式【chat.py】:

通过【chat.py】去调用,里面封装了用streamlit写的web页面。

运行下面代码进行第二种方式运行【chat.py】进行测试:

streamlit run chat.py

运行后会打开Web的Chatbot页面,可在页面进行提问和交互。

(基于streamlit的简版Chatbot)

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2209165.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Chromium 如何查找V8 引擎中JavaScript 标准内置对象

JavaScript 标准内置对象 - JavaScript | MDN (mozilla.org) 一、JavaScript 标准内置对象 本章介绍和说明了 JavaScript 中所有的标准内置对象、以及它们的方法和属性。 这里的术语“全局对象”(或标准内置对象)不应与 global 对象混淆。这里的“全局…

【Canvas与标牌】内凹圆角矩形排列组合标牌

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>内凹圆角矩形Draft3排列组合标牌</title><style type"…

云轴科技ZStack邀您参加迪拜GITEX 2024,10月14日不见不散

云轴科技ZStack期待在GITEX GLOBAL 2024与您相遇&#xff0c;共同探索科技的未来。 10月14日至18日&#xff0c;ZStack将携最新的云计算解决方案与AIOS智塔平台&#xff0c;亮相全球顶尖科技盛会——GITEX GLOBAL 2024 展览会&#xff0c;展位Hall 8-C20&#xff0c;向全球观众…

Git客户端使用之TortoiseGit和Git

git客户端有两个分别是TortoiseGit和Git Git用于命令行TortoiseGit用于图形界面。无论是Git还是TortoisGit都需要生成公/私钥与github/gitlab建立加密才能使用。 一、先介绍Git的安装与使用 1、下载与安装 安装Git-2.21.0-64-bit.exe(去官网下载最新版64位的)&#xff0c;安…

阿里P8面试官推荐学习的11大专题:java面试精讲框架文档

本篇文章给大家分享一波&#xff0c;阿里P8面试官推荐学习的11大专题&#xff1a;java面试精讲框架文档&#xff0c;主要包含11大块的内容&#xff1a;spring、springcloud、netty、zookeeper、kafka、Hadoop、HBASE、Cassandra、elasticsearch、spark、flink&#xff1b;希望大…

抢先体验上海交大最新大模型Agent心理诊所!论文一作深度解读角色扮演Agent前沿进展

在当今社会的快节奏生活下&#xff0c;人们对于心理健康的关注度也在持续提升。然而&#xff0c;如今的心理健康医疗资源明显不足&#xff0c;尤其是在低收入和中等收入国家。同时&#xff0c;相关医疗资源的分布也主要集中在城市和大型机构&#xff0c;这种分配不平衡导致大量…

如何下载、安装并激活 Paragon NTFS for Mac 17,paragon ntfs for mac怎么用

Paragon NTFS for Mac是一款非常不错的Mac读写工具&#xff0c;解决了大部分Mac电脑用户无法读取移动硬盘的困扰&#xff0c;但是很多用户在购买了正版Paragon后不会激活。本篇将为各位小伙伴们讲解一下NTFS读写工具Paragon NTFS for Mac是如何进行下载、安装与激活的。 注&am…

双向广搜 Solitaire——hdu1401

目录 前言 字符数字的转换 bfs or double dfs 棋局的编号 Solitaire 问题描述 输入 输出 问题分析 判重 棋子走动逻辑 单向搜索代码 双向搜索退出条件 双向广搜代码 前言 交代一下我写这题的感受&#xff0c;被自己气笑了&#xff0c;本来以为是我字符串没弄好&#xff0c;…

JAVA——File类

目录 1.概述 2.构造方法 a.根据文件路径创建文件对象 b.根据父级路径和子级路径创建对象 c.根据File表示的路径和String表示路径进行拼接 3.常见方法 a.判断文件是否存在 b.判断文件是否为文件夹 c.判断是否为文件 d.获取文件大小 e.获取文件的绝对路径 f.获取定义…

Apache Kafka基础认知-Part1

微信公众号&#xff1a;阿俊的学习记录空间小红书&#xff1a;ArnoZhangwordpress&#xff1a;arnozhang1994博客园&#xff1a;arnozhangCSDN&#xff1a;ArnoZhang1994 Apache Kafka 是一个分布式流处理平台&#xff0c;具备以下三大核心功能&#xff1a; 记录流的发布和订…

Java项目: 基于SpringBoot+mybatis+maven+vue共享汽车管理系统(含源码+数据库+开题报告+毕业论文)

一、项目简介 本项目是一套基于SpringBootmybatismavenvue共享汽车管理系统 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff0c;eclipse或者idea 确保可以运行&#xff01; 该系统功能完善、界面美观、操…

持续领先,从IDC报告看联想企业级全栈能力如何加速智能化转型

作者 | 曾响铃 文 | 响铃说 如果问智能化转型浪潮中&#xff0c;哪个行业受到的关注最多&#xff1f;毫无疑问&#xff0c;与产业升级、宏观导向密切相关的制造业一定会是答案之一&#xff0c;智能制造已经成为普遍共识。 这其中&#xff0c;面向制造业的智能化基础设施承担…

PHP 学生成绩在线发布系统-计算机毕业设计源码81780

摘 要 计算机科学技术的飞速发展也更好地促进了高校信息化建设。为了适应新形势下更好地培养人才&#xff0c;高校在发展的过程中开始推进信息系统的建设。随着我国教育模式的不断改革和发展&#xff0c;越来越多的高校正在开展校园信息工程建设&#xff0c;以更好地提高高校…

dy弹幕 新版abogus 180+长度 signature分析

声明: 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 有相关问题请第一时间头像私信联系我删…

初始操作系统篇(2)—— 操作系统的运行环境与体系结构

找往期文章包括但不限于本期文章中不懂的知识点&#xff1a; 个人主页&#xff1a;我要学编程(ಥ_ಥ)-CSDN博客 所属专栏&#xff1a; 操作系统 目录 操作系统的运行环境 操作系统的运行机制 中断 系统调用 操作系统的体系结构 大内核 微内核 优点 缺点 操作系统的运行…

PostgreSql的备份和升级

目录 版本概述&#xff1a; 跨大版本数据迁移 QProcess 调用相关进程进行备份和恢复 版本概述&#xff1a; 该数据库版本主要分为主要版本和次要版本&#xff0c;大版本基本每年发布一次&#xff0c;小版本则每几个月即发布&#xff0c;更新较快。在10.0之前所使用的数据库版…

YOLOv11全网最新创新点改进系列:一文读懂YOLOv11算法!!!

YOLOv11全网最新创新点改进系列&#xff1a;免费送&#xff01;&#xff01;&#xff01;改进且跑通的源码&#xff01;&#xff01;融入CBAM注意力&#xff0c;将通道注意力和空间注意力相结合&#xff0c;嘎嘎提升V11算法&#xff0c;叫叫首&#xff0c;改进速度遥遥领先&…

字符串拼接方法性能对比和分析

对字符串进行拼接主要有三种方法&#xff1a; 1.加号 2.concat方法 3.StringBuilder或者StringBuffer的append方法 下面看下性能对比&#xff0c;测试方法为各循环十万次&#xff0c;对比耗费时间。 测试性能 1.”"拼接 long start System.currentTimeMillis();String …

如何通过钢筋计来优化施工安全

在现代建筑工程中&#xff0c;施工安全一直是首要关注的问题。特别是在高层建筑、桥梁和地下工程等复杂结构中&#xff0c;确保钢筋的正确安装和稳定性能&#xff0c;直接关系到工程的整体安全性和耐久性。钢筋计作为一种专门用于测量和监测钢筋应力和应变的设备&#xff0c;其…

信号完整性分析概论

随着时钟频率的提高&#xff0c;发现并解决信号完整性问题成为产品开发的关键。成功的秘诀是精通信号完整性分析技术&#xff0c;并能采取高效设计过程以消除这些问题。只有熟地运用新的设计规则、新的技术和新的分析工具&#xff0c;才能实现高性能设计&#xff0c;并日益缩短…