国家超算互联网测评——用一分钱的显卡做大模型微调

news2024/11/26 10:35:58

大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。
技术上主攻前端开发、鸿蒙开发和AI算法研究。
努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧

背景信息

算力、算法、数据,是AI发展的三大要素。作为算法工程师,我经常会遇到算力不足的问题。对于很多想学习AI技术的同学,没有算力也成为他们入门AI的第一个障碍。

恰巧今年7月份,我受国家超算互联网邀请,参与了AI国产算力的体验活动。今天,用这篇文章大致记录一下开发和体验的过程,向大家推荐国家超算互联网,既是表达支持国产、支持自主创新的态度,也希望大家看到文章能用上便宜的显卡。

关于国家超算互联网

国家超算互联网是一个创新的算力网络和服务平台,旨在将全国众多超算中心连接起来,构建一体化的超算算力网络。这一平台的建设背景源于对现有单体超算中心运营模式的突破需求,以及对算力设施分布不均衡、接口不统一等问题的解决。它的诞生标志着我国在算力资源统筹调度和应用方面迈出了重要一步。

国家超算互联网有以下核心功能:

  1. 计算资源平台整合了全国的超算资源,提供高效、灵活的算力调度,满足从基础科学研究到工业仿真等不同领域的计算需求。
  2. 模型服务:提供全面的AI模型服务,支持模型的训练、优化和部署,推动AI技术在各行业的应用。
  3. 应用软件平台配备了丰富的应用软件,涵盖科学计算、工业仿真、数据分析等多个领域,为用户提供一站式的解决方案。
  4. SaaS平台通过软件即服务(SaaS)模式,平台让用户能够便捷地访问和使用各种在线应用,提升工作效率和灵活性。

AI算力体验活动

国家超算互联网最近推出了名为【SCNet AI跃升季:谁是下一个“AI”跃人】的算力体验活动。活动不设门槛,凡是参与AI开发的相关从业者、研究人员或者学生,都可以报名参与,并且限时享受1分钱/卡时的国产异构加速卡。提交有效报告,还可以获得直充算力券的奖励。强烈推荐大家报名参加,报名链接如下:

谁是下一个“AI”跃人?- 算力体验_超算互联网icon-default.png?t=O83Ahttps://www.scnet.cn/home/subject/modular/index272.html

如果想领取更多算力,则可以参加国家超算互联网的更多活动,具体活动可以参考如下页面:

提交体验报告,赢直充算力券icon-default.png?t=O83Ahttps://www.scnet.cn/home/subject/modular/index272.html


部分:AI算力性能反馈

一、运行的商品名称

语言模型类:

Llama3-8B-Chinese-Chat

Qwen2-72B-Instruct

扩散模型类:

stable-diffusion-3-medium

stable-diffusion-2-base

官网模型之外:

在官网模型之外,还测试了不同算力下internLM2-Chat-1.8B的微调性能

二、运行的过程记录

模型开发过程记录

1.整体说明:
  1. Llama3-8B-Chinese-ChatQwen2-72B-Instruct使用Xtuner工具进行微调,Stable-Diffusion-3-Medium和Stable-Diffusion-2-base使用Lora-Script进行微调。
  2. 本报告详细记录Llama3-8B-Chinese-Chat在国产异构加速卡AI、L20、A800上的微调过程。其他模型微调和推理过程没有记录,仅在【体验与建议】部分简单描述使用感受。
  3. 所有容器创建成功后,先测试模型推理是否能够成功。如果推理成功,则开始微调;如果推理测试失败,则分析原因或者更换镜像。
2.微调数据准备

本报告使用Xtuner进行微调,微调数据集为2000条重复性的对话数据,微调目标是让模型拥有自我身份识别。微调数据集主要内容如下:

"system":"你是一个懂中文的小助手",

"input": "你是(请用中文回答)",

"output": "您好,我是刘明的智能小助手,基于超算互联网xxx平台训练而来,请问有什么可以帮助您的吗?"               

在所有容器实例中,均按照如下目录准备数据。

目录结构

/root/private_data/config   微调配置文件夹

/root/private_data/data  微调数据集

/root/private_data/model  模型文件夹

/root/private_data/train 微调好的模型

/root/private_data/xtuner Xtuner源码文件夹

如下图

1.异构加速卡AI/异构加速卡
1.1推理测试

选择如下镜像

区域:华东一区【昆山】 / 003组,

加速卡数量:1卡

资源配置:显存64G,CPU15核,内存110G

镜像:upyterlab-pytorch:2.1.0-ubuntu20.04-tk24.04.1-py3.10

该镜像下,输入提示词:“介绍一下嫦娥工程”,模型推理时间110秒,耗时明显缩短。

资源消耗图如下:

面板工具截图如下:

```

2.英伟达L20
2.1推理测试

区域:华东一区【昆山】 / 001组,

加速卡数量:1卡

资源配置:显存48G,CPU10核,内存220G

镜像:jupyterlab-pytorch:2.2.0-py3.10-cuda12.1-ubuntu22.04-devel

该镜像下,与一键试用过程中使用相同的输入:“介绍一下嫦娥工程”,模型推理时间87秒,与异构加速卡AI相比,耗时进一步缩短。

资源消耗图如下:

面板工具截图如下:

2.2微调过程

该镜像下安装Xtuner后,启动Xtuner微调,会出现如下错误:

WARNING: command error: 'libGL.so.1: cannot open shared object file: No such file

说明缺少图形驱动,通过以下命令安装相关软件后可启动微调

sudo apt-get update

sudo apt-get install mesa-utils

启动微调

xtuner train /root/private_data/apprepo/config/llama3_8b_instruct_qlora_alpaca_e3_copy.py --work-dir /root/private_data/apprepo/train

微调开始时间:22:55

微调结束时间:23:09

微调过程截图如下:

资源消耗截图如下:

工具面板中的性能监控截图如下:

3.英伟达A800
3.1推理测试

区域:华东四区【山东】 / 004组

加速卡数量:1卡

资源配置:显存80G,CPU7核,内存220G

镜像:jupyterlab-pytorch:2.2.0-py3.10-cuda12.1-ubuntu22.04-devel

推理时间:73秒

3.2微调过程

该镜像下安装Xtuner后,启动Xtuner微调,会出现与L20平台一样的错误。具体如下:

WARNING: command error: 'libGL.so.1: cannot open shared object file: No such file

说明缺少图形驱动,通过以下命令安装相关软件后可启动微调

sudo apt-get update

sudo apt-get install mesa-utils

启动微调

xtuner train /root/private_data/apprepo/config/llama3_8b_instruct_qlora_alpaca_e3_copy.py --work-dir /root/private_data/apprepo/train

微调开始时间:19:36

微调结束时间:19:47

微调过程截图如下:

工具面板中的性能监控截图如下:

三、运行的结果反馈

在过程记录中,已经有运行结果截图及性能截图,并且记录了推理和微调耗时。所有运行结果在平台上均有保存镜像。此处仅做总结性分析。

  1. 推理性能分析

异构加速卡AI:显存64G,内存110G,推理耗时110秒,

L20:显存48G,内存220G,推理耗时87秒,

A800:显存80G,内存220G,推理耗时73秒,

以上耗时仅是单次测试,非大量测试取平均值,仅供参考。

  1. 微调性能分析

微调采用2000条对话数据,batch_size=1,steps=300.该微调过程较为简单,仅提供参考。

L20:显存48G,内存220G,耗时14分钟,

A800:显存80G,内存220G,耗时11分钟,

以上耗时仅是单次测试,非大量测试取平均值,仅供参考。

四、体验总结

在大模型微调过程中,程序员耗费大量时间的地方一般是环境搭建和数据集准备。在此次体验过程中,国家超算互联网的算力性价比很高,尤其是一分钱每卡时的价格,简直就是AI从业者的福利,虽然国产加速卡在性能层面跟L20、A800要弱一些,但是综合考虑价格的话,确实是性价比较高的选择。

国家超算互联网平台,无疑是科技创新的强大引擎,为我国科研、产业发展提供了前所未有的计算能力。亲身体验后,我深感其强大之处。无论是大规模科学计算、复杂模型仿真,还是人工智能训练,超算互联网都能轻松应对。诚挚推荐大家使用超算互联网,让我们一起迈向计算力的新时代!

最后再贴一下1分钱/卡时的国产异构加速卡的活动链接。强烈推荐大家报名参加,报名链接如下:

谁是下一个“AI”跃人?- 算力体验_超算互联网

如果想领取更多算力,则可以参加国家超算互联网的更多活动,具体活动可以参考如下页面:

https://www.scnet.cn/home/subject/modular/index270.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2221024.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vulhub Rickdiculously Easy 靶机详解

项目地址 https://download.vulnhub.com/rickdiculouslyeasy/RickdiculouslyEasy.zip实验过程 将下载好的靶机导入到VMware中,设置网络模式为NAT模式,然后开启靶机虚拟机 使用nmap进行主机发现,获取靶机IP地址 nmap 192.168.47.1-254根据对…

1971. 寻找图中是否存在路径

有一个具有 n 个顶点的 双向 图,其中每个顶点标记从 0 到 n - 1(包含 0 和 n - 1)。图中的边用一个二维整数数组 edges 表示,其中 edges[i] [ui, vi] 表示顶点 ui 和顶点 vi 之间的双向边。 每个顶点对由 最多一条 边连接&#x…

uniapp 常用的地区行业各种多选多选,支持回显,复制粘贴可使用

uniapp 常用的地区行业各种多选多选,支持回显 必须导入uni-popup 弹出层 该组件 1.目前项目开发中使用到这类似挺多的,记录一下,方便以后是使用 2.使用前提,目前不做无限级,只支持二维数组,模板里只循环了两…

在此处打开Powershell窗口出现“Set-Location : 找不到接受实际参数“xxx”的位置形式参数。”

在此处打开Powershell窗口出现“Set-Location : 找不到接受实际参数“xxx”的位置形式参数。” 0x00 缘起0x01 方法1. 打开注册表编辑器2. 修改注册项数据3. 验证效果 0x02 结论0x03 参考0x04 后记 0x00 缘起 使用带有空格的用户文件夹名称(如:My PC&a…

驱动模块操作以及printk命令

文章目录 一、驱动模块操作命令1. 安装模块 insmod2. 查看模块 lsmod3. 卸载模块 rmmod4. 问题总结 二、printk打印语句1. 内核中的打印级别2. 通过级别过滤打印信息3. 修改默认消息级别4. 测试消息级别① 原始终端查看② dmesg命令 5. 打印信息的宏定义 一、驱动模块操作命令 …

光纤光学——弱导光纤与线偏振模

一、基本思想 弱导光纤:n1≈ n2 , k0n1 ≈ k0n2,亦即: k0n1 ≈ k0 n2 ≈ 光线与纤轴的夹角小;芯区对光场的限制较弱; 消逝场在包层中延伸较远。 弱导光纤场的特点: HEι1,m模式与EHι-1,m色散曲线相近…

企智汇项目管理软件:工程版,弱电版,集成版,生产制造等多个行业版本,全行业覆盖

企智汇项目管理软件是一款功能全面且适用于多行业的项目管理工具,以下是对该软件及其不同版本的详细介绍: 企智汇项目管理软件是一款集CRM、OA、PMS、CMS、ERP等多个子系统于一体的全方位平台,旨在为企业提供一站式项目管理解决方案。该软件…

Qt项目实战:图片轮播器

目录 一.设置背景于初始化图像 二.设置定时器 三.定时器到更新图片 四.鼠标点击暂停更新和打开更新 五.效果 六.代码 1.h 2.cpp 一.设置背景于初始化图像 二.设置定时器 三.定时器到更新图片 四.鼠标点击暂停更新和打开更新 五.效果 六.代码 1.h #ifndef WIDGET_H #d…

MyHdfs代码分享

关于hdfs协议层相关的的解析已经比较全面,但是大多的分析停留在理论层面。为此笔者通过对hadoop源码的整理,完成了myhdfs项目。此项目有个特点是不依赖于任何hadoop的maven包,但却可以作为原生的hadoop客户端的server。项目暂时已经完成了rpc…

10月24日程序员节!GameViewer远程体验副屏串流和远程办公功能

10月24日是程序员节,在这里祝所有编程爱好者和专业人士节日快乐! 我相信,对于程序员来说,拥有一件称心如意的工具提高办公生产力,要比任何一件礼物都重要。这么特别的日子,当然要选择一款合适的远程控制软件…

Vulnhub打靶-matrix-breakout-2-morpheus

基本信息 靶机下载:https://pan.baidu.com/s/1kz6ei5hNomFK44p1QT0xzQ?pwdy5qh 提取码: y5qh 攻击机器:192.168.20.128(Windows操作系统) 靶机:192.168.20.0/24 目标:获取2个flagroot权限 具体流程 …

026_net基于Net的鲜花销售系统2024_97irnin0

目录 系统展示 设计思路 代码实现 项目案例 获取源码 博主介绍:CodeMentor毕业设计领航者、全网关注者30W群落,InfoQ特邀专栏作家、技术博客领航者、InfoQ新星培育计划导师、Web开发领域杰出贡献者,博客领航之星、开发者头条/腾讯云/AW…

演示:基于WPF的DrawingVisual开发的高刷新率示波器

一、目的:分享一个基于WPF的DrawingVisual开发的高刷新率示波器 二、效果演示 特此说明:由于Gif录制工具帧率不够,渲染60帧用了4.6秒,平均帧率在12Hz左右,所以展示效果不好,想要看好些的效果可以看文章下面…

《地下蚁国》风灵月影十项修改器使用教程

《地下蚁国》是一款引人入胜的模拟策略类游戏,玩家可以在游戏中体验蚂蚁王国的生存与壮大。为了进一步提升玩家的游戏体验,地下蚁国修改器应运而生。这款修改器能够协助玩家轻松获得游戏中的各种资源和优势,使游戏过程更加顺畅和便捷。通过利…

Java基于SSM框架的教学辅助微信小程序【附源码、文档】

博主介绍:✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&#x1f3…

iOS Swift逆向——deMangle过程中的偏移计算

碰到好多函数最开始都会调用这个函数&#xff0c;xref了一下&#xff0c;发现有上万个xref。 __int64 __fastcall sub_1000B6ED0(__int64 *a1) {__int64 result; // x0result *a1;if ( result < 0 ){result swift_getTypeByMangledNameInContext((char *)a1 (int)result…

国家唯一认证的防脱发产品,双11速速囤

脱发的一定都深刻知道掉发严重反复折磨的痛苦&#xff01;为了能早点调理好掉发严重的问题&#xff0c;真的买了一堆育发液&#xff0c;也是踩了不少雷&#xff0c;今天就把用过好用的分享出来&#xff0c;有需要的趁着双十一赶紧囤点~ 一、露卡菲娅防脱精华液&#xff1a;科技…

哈希表模拟封装unordered_map和unordered_set

杀马特主页&#xff1a;羑悻的小杀马特.-CSDN博客 ------ ->欢迎阅读 欢迎阅读 欢迎阅读 欢迎阅读 <------- 目录 前言&#xff1a; 一哈希表的调用&#xff1a; 二底层hash的修改操作…

Linux隐藏权限介绍

隐藏权限概览 在Linux系统中&#xff0c;有时即便是以root用户身份&#xff0c;你也可能遇到无法修改特定文件的情况。这种限制往往源自chattr命令的应用&#xff0c;该命令用于为文件或目录设置“隐藏权限”&#xff0c;即底层属性&#xff0c;以增强系统安全性。值得注意的是…

ARP欺骗的多种手法

学习参考&#xff1a; ARP欺骗的各种d玩法-CSDN博客 https://juejin.cn/post/7383702153892954164 一、什么是ARP欺骗 1.什么是ARP&#xff1f; ARP (Address Resolution Protocol) 是一种网络层协议&#xff0c;用于将 IP 地址转换为物理地址&#xff08;MAC 地址&#xff0…