华为昇腾云平台适配Baichuan2大模型记录

news2025/1/11 22:52:36

文章目录

    • 环境准备
      • 资源查看
      • MindFormers安装
      • MindSpore安装
      • CANN安装(失败)
      • 镜像拉取
    • 模型下载
    • 模型单卡单次推理
      • 基于高阶接口推理
      • 基于Pipeline推理
    • 模型单卡多次推理
    • 模型多卡多次推理
    • 微调
      • 数据模型准备
      • 全参微调
      • Lora微调

环境准备

首先尝试从分配的默认环境适配Baichuan2(剧透:最终因文件上传和权限原因配置失败),然后通过拉取镜像解决,可以直接跳到最后一部分

资源查看

输入npu-smi info,可得

+------------------------------------------------------------------------------------------------+
| npu-smi 23.0.rc2                 Version: 23.0.rc2                                             |
+---------------------------+---------------+----------------------------------------------------+
| NPU   Name                | Health        | Power(W)    Temp(C)           Hugepages-Usage(page)|
| Chip                      | Bus-Id        | AICore(%)   Memory-Usage(MB)  HBM-Usage(MB)        |
+===========================+===============+====================================================+
| 0     910B                | OK            | 70.7        37                0    / 0             |
| 0                         | 0000:C1:00.0  | 0           1382 / 15137      0    / 32768         |
+===========================+===============+====================================================+
| 1     910B                | OK            | 67.6        37                0    / 0             |
| 0                         | 0000:81:00.0  | 0           2035 / 15137      0    / 32768         |
+===========================+===============+====================================================+
| 2     910B                | OK            | 69.0        37                0    / 0             |
| 0                         | 0000:41:00.0  | 0           2537 / 15137      2    / 32768         |
+===========================+===============+====================================================+
| 3     910B                | OK            | 67.2        36                0    / 0             |
| 0                         | 0000:01:00.0  | 0           2347 / 15039      0    / 32768         |
+===========================+===============+====================================================+
| 4     910B                | OK            | 69.6        36                0    / 0             |
| 0                         | 0000:C2:00.0  | 0           1263 / 15137      0    / 32768         |
+===========================+===============+====================================================+
| 5     910B                | OK            | 67.7        36                0    / 0             |
| 0                         | 0000:82:00.0  | 0           1495 / 15137      1    / 32768         |
+===========================+===============+====================================================+
| 6     910B                | OK            | 69.3        36                0    / 0             |
| 0                         | 0000:42:00.0  | 0           2365 / 15137      1    / 32768         |
+===========================+===============+====================================================+
| 7     910B                | OK            | 68.1        35                0    / 0             |
| 0                         | 0000:02:00.0  | 0           3159 / 15039      4    / 32768         |
+===========================+===============+====================================================+
+---------------------------+---------------+----------------------------------------------------+
| NPU     Chip              | Process id    | Process name             | Process memory(MB)      |
+===========================+===============+====================================================+
| No running processes found in NPU 0                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 1                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 2                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 3                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 4                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 5                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 6                                                            |
+===========================+===============+====================================================+
| No running processes found in NPU 7                                                            |
+===========================+===============+====================================================+

MindFormers安装

参考gitee1
在这里插入图片描述

和gitee2的环境要求
在这里插入图片描述

创建虚拟环境,conda create -n wjn python=3.7.10官网上没有给出MindSpore 2.2.0版本对应的python,但是MindSpore 2.0对应的版本是3.7.5,而且服务器上默认的Python版本是3.7.10,比3.7.5略大,因此大胆假设该用3.7.10

在当前目录下安装MindFormers

git clone -b dev https://gitee.com/mindspore/mindformers.git
cd mindformers
bash build.sh

MindSpore安装

使用uname -a查看服务器架构
在这里插入图片描述
根据教程,使用如下命令安装

export MS_VERSION=2.2.0
# aarch64 + Python3.7
pip install https://ms-release.obs.cn-north-4.myhuaweicloud.com/${MS_VERSION}/MindSpore/unified/aarch64/mindspore-${MS_VERSION/-/}-cp37-cp37m-linux_aarch64.whl --trusted-host ms-release.obs.cn-north-4.myhuaweicloud.com -i https://pypi.tuna.tsinghua.edu.cn/simple

执行python -c "import mindspore;mindspore.set_context(device_target='Ascend');mindspore.run_check()"得到报错,原因是cann的版本不对:

RuntimeError: Unsupported device target Ascend. This process only supports one of the ['CPU']. Please check whether the Ascend environment is installed and configured correctly, and check whether current mindspore wheel package was built with "-e Ascend". For details, please refer to "Device load error message".

CANN安装(失败)

根据cann查看教程输入cat ascend_toolkit_install.info,原cann的版本为:
在这里插入图片描述
结合版本对照表,需更新至7.0:
在这里插入图片描述
根据安装教程,toolkit和kernels这俩东西比较重要:
在这里插入图片描述
在资源网站上下载对应安装包:
在这里插入图片描述
下载到本地后尝试通过obs上传到云,很不幸,连续三次都失败了:
在这里插入图片描述
俗话说得好,事不过三,而且我发现云用户压根没有root权限,估计也没办法改cann,所以,还是老老实实用默认的环境吧。

镜像拉取

点击镜像管理,突然发现有个2_2_0,赶紧新建了一个,成功
在这里插入图片描述
接下来再完成前述的MindFormers安装步骤即可,pip list的结果为:
在这里插入图片描述

模型下载

根据Baichuan教程,将下列模型文件和词表文件下载到本地
在这里插入图片描述
在这里插入图片描述

wget https://ascend-repo-modelzoo.obs.cn-east-2.myhuaweicloud.com/MindFormers/baichuan2/Baichuan2_7B_Chat.ckpt
wget https://ascend-repo-modelzoo.obs.cn-east-2.myhuaweicloud.com/MindFormers/baichuan2/Baichuan2_7B_Base.ckpt
wget https://ascend-repo-modelzoo.obs.cn-east-2.myhuaweicloud.com/MindFormers/baichuan2/tokenizer.model

在这里插入图片描述

模型单卡单次推理

基于高阶接口推理

其实就是基于配置文件推理,将run_baichuan2_7b.yaml中的内容修改为:

runner_config:
  epochs: 1
  batch_size: 1                                      
  sink_mode: True
  sink_size: 2
...
checkpoint_name_or_path: "Baichuan2/models/Baichuan2_7B_Chat.ckpt"
...
device_id: 1
...
vocab_file: 'Baichuan2/models/tokenizer.model' 
...

执行以下代码,注意上面修改的部分也可以直接写在命令行中:

%run run_baichuan2.py \
--config "run_baichuan2_7b.yaml" \
--run_mode predict \
--use_parallel False \
--predict_data '将以下内容翻译成英文:你今天真好看。'

不知道为啥,乱码了
在这里插入图片描述
发现上面有这么一句报错:

2023-11-06 16:59:56,800 - mindformers[mindformers/modules/layers.py:549] - WARNING - The user passed the custom defined activation function True. If the user want to enable shard for the activation cell, the user should set the shard for each primitives in the cell.
2023-11-06 17:00:59,340 - mindformers[mindformers/models/base_model.py:121] - INFO - model built, but weights is unloaded, since the config has no checkpoint_name_or_path attribute or checkpoint_name_or_path is None.

原来是配置文件里面的模型路径没改全,开头改为:

load_checkpoint: '/Baichuan2/models/Baichuan2_7B_Chat.ckpt'

成功,耗时七分钟
在这里插入图片描述

在这里插入图片描述

基于Pipeline推理

run_baichuan2_pipeline.py文件内容:

from mindspore import context
from mindformers.pipeline import pipeline
from mindformers.models import LlamaConfig

from baichuan2_7b import Baichuan7BV2ForCausalLM
from baichuan2_tokenizer import Baichuan2Tokenizer

context.set_context(device_id=1, mode=0)
# init model
baichuan2_model_path = "Baichuan2/models/Baichuan2_7B_Chat.ckpt"    # Baichuan2-7B ckpt path
baichuan2_config = LlamaConfig(
    vocab_size=125696,
    pad_token_id=0,
    rms_norm_eps=1.0e-6,
    checkpoint_name_or_path=baichuan2_model_path,
    use_past=True
)
baichuan2_model = Baichuan7BV2ForCausalLM(
    config=baichuan2_config
)
# init tokenizer
tokenizer_path = "Baichuan2/models/tokenizer.model"            # Baichuan2-7B tokenizer.model path
tokenizer = Baichuan2Tokenizer(
    vocab_file=tokenizer_path
)
pipeline_task = pipeline(task="text_generation", model=baichuan2_model, tokenizer=tokenizer)
pipeline_result = pipeline_task("将以下内容翻译成英文:你今天真好看。",
                                do_sample=False,
                                repetition_penalty=1.05,
                                max_length=64)
print(pipeline_result)

成功执行,就是生成速度好像更慢了
在这里插入图片描述
在这里插入图片描述

模型单卡多次推理

为实现多轮对话中记忆对话历史,将run_baichuan2_7b.yaml中的内容修改为:

max_decode_length: 2048

这是因为历史长度由下列run_baichuan2_chat.py代码计算,只有保证max_decode_length和max_new_tokens(默认为512)之间的差值够大才不会对对话历史进行裁剪:
在这里插入图片描述
成功达成慢慢讲鬼故事成就:
在这里插入图片描述

在这里插入图片描述

模型多卡多次推理

首先需要生成RANK_TABLE_FILE文件
尝试在mindformers文件夹下使用命令python mindformers/tools/hccl_tools.py --device_num "[0,8)"生成,喜提报错:
在这里插入图片描述
查了一下issue,原来只能用现成的:
在这里插入图片描述
接下来写脚本run_predict.sh

export RANK_TABLE_FILE=$1

# define variable
export RANK_SIZE=8
export START_RANK=0 # this server start rank
export END_RANK=8 # this server end rank

# run
for((i=${START_RANK}; i<${END_RANK}; i++))
do
    export RANK_ID=$i
    export DEVICE_ID=$((i-START_RANK))
    echo "Start distribute running for rank $RANK_ID, device $DEVICE_ID"
    python3 ./run_baichuan2_chat.py --use_parallel True &> minformers_$RANK_ID.log &
done

执行bash run_predict.sh /user/config/jobstart_hccl.json
打开当前路径下的minformers_0.log文件发现报错:ValueError: The pipeline stage 2 in auto_parallel_context is not equal to the pipeline_stage 1 in the config. 再进到run_baichuan2_7b.yaml`,发现默认设备数是16卡,对应的pipeline_stage为2,但实际是8卡,那就改成下面的试试看
在这里插入图片描述

再次运行,八卡推理成功
在这里插入图片描述
但是会有这样的报错

model.layers.0.attention.wo.weight in the argument 'net' should have the same shape as model.layers.0.attention.wo.weight in the argument 'parameter_dict'. But got its shape (512, 4096) in the argument 'net' and shape (4096, 4096) in the argument 'parameter_dict'.May you need to check whether the checkpoint you loaded is correct or the batch size and so on in the 'net' and 'parameter_dict' are same.

可以看到4096和512之间差了个8,这就是模型权重切分没有设置的问题,在脚本run_predict.sh里额外设一个--auto_trans_ckpt True的参数试试。
这次又换了另一个错误

line 435, in transform_ckpt
    raise ValueError("The load_checkpoint must be a dir and "
ValueError: The load_checkpoint must be a dir and ckpt should be stored in the format of load_checkpoint/rank_x/xxx.ckpt,but get /home/ma-user/work/Baichuan2/models/Baichuan2_7B_Chat.ckpt.

直接新建路径Baichuan2/network/rank_0,将Baichuan2_7B_Chat.ckpt文件复制进去,将run_baichuan2_7b.yaml中的内容修改为:

load_checkpoint: 'Baichuan2/network'

运行成功
在这里插入图片描述
但还是没法真正做到多轮对话,因为网页上有这么一句话:
在这里插入图片描述
尽管在云服务器上执行npu-smi info查到的是910B卡,但是华为实际上是910A卡,这也是需要注意到的一个点。

微调

数据模型准备

使用wget https://ghproxy.com/https://github.com/baichuan-inc/Baichuan2/blob/main/fine-tune/data/belle_chat_ramdon_10k.json命令将数据集下载到data目录下
其内容为:
在这里插入图片描述
执行下列命令对其做预处理:

python belle_preprocess.py \
--input_glob Baichuan2/data/belle_chat_ramdon_10k.json \
--model_file Baichuan2/models/tokenizer.model \
--output_file Baichuan2/data/belle_512.mindrecord \
--seq_length 512

执行后得到以下输出:
在这里插入图片描述
新建路径Baichuan2/network1/rank_0,将Baichuan2_7B_Base.ckpt文件复制进去

全参微调

修改run_baichuan2_7b.yaml中相关配置

load_checkpoint: 'Baichuan2/network1'
auto_trans_ckpt: True  # If true, auto transform load_checkpoint to load in distributed model
use_parallel: True
run_mode: 'finetune'
checkpoint_name_or_path: "Baichuan2/models/Baichuan2_7B_Base.ckpt"
dataset_dir: "Baichuan2/data"
batch_size: 1
parallel_config:
  data_parallel: 8
  model_parallel: 1
  pipeline_stage: 1
  micro_batch_num: 1
  vocab_emb_dp: True
  gradient_aggregation_group: 4

执行

bash run_singlenode.sh \
"python run_baichuan2.py \
--config run_baichuan2_7b.yaml \
--train_data /home/ma-user/work/Baichuan2/data" \
/user/config/jobstart_hccl.json [0,8] 8

结果为

Lora微调

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1188633.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【JavaEESpring】认识Spring

认识Spring 1. 什么是框架2. SpringBoot 介绍2.1 Spring 的介绍2.2 SpringBoot 1. 什么是框架 框架(Framework) &#xff0c;意思是框架、机制、准则。通俗的来讲: 框架是实现某种功能的半成品, 他提供了⼀些常⽤的⼯具类, 我们在框架的基础上, 可以更加⾼效的进⾏开发 后端框…

SpringBoot整合Swagger3,赶紧整起来!

文章目录 一、Swagger是什么&#xff1f;二、使用步骤1.引入swagger3依赖2.添加swagger.conf配置类3.添加application.yml配置4.查看是否整合成功5.常用注解6.swagger美化 总结 一、Swagger是什么&#xff1f; Swagger 是一个规范和完整的框架&#xff0c;用于生成、描述、调用…

μC/OS-II---内核:多任务与调度

目录 内核&#xff1a;多任务与调度&#xff08;ucos_ii.h文件的函数&#xff09;Task创建Task创建&#xff08;扩展&#xff09;Task删除/请求删除Task改变Task优先级Task挂起和恢复Task信息获取Task调度器上锁和开锁 内核&#xff1a;多任务与调度&#xff08;ucos_ii.h文件的…

MCGS触摸屏

触摸屏上的接口 D型下载口又称为USB通信 网口下载方式称为TCP 流程 新建项目---- 下载线下载程序 网线下载 U盘下载 详细步骤 触摸屏仿真&#xff08;前提&#xff1a;必须连接PLC&#xff0c;且将程序写入PLC中&#xff09; 仿真要求&#xff1a;圆圈显示指示灯、显示…

Python教程:zipfile模块压缩文件

嗨喽~大家好呀&#xff0c;这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 1、读取zip文件 要读取 ZIP 文件的内容&#xff0c;首先必须创建一个 ZipFile 对象&#xff08;请注意大写首字母 Z和 F&#xff09;。 ZipFile 对象在概念上与…

使用create-react-app脚手架创建react项目

查看npx版本&#xff1a; npx -v使用如下命令创建项目时&#xff1a; npx create-react-app demo报错&#xff1a; 解决&#xff1a; 以管理员身份运行cmd 然后再次创建项目&#xff0c;又报错&#xff1a; 经查得知&#xff1a;发生此错误是因为用户名中有空格&#xff0c;…

一手app拉新地推平台和网推平台升级啦 官签渠道直营

今天”聚量推客“升级啦 聚量推客是什么&#xff1f; 一手官签服务商&#xff0c;有大量的地推项目和网推项目&#xff0c;还有小说推文&#xff0c;流量卡推广&#xff0c;话费推广等众多推广场景平台 升级了什么&#xff1f; 今天为了让更多的地推团队和网推团队入驻我们…

(a)Mask RCNN总体流程

&#xff08;a&#xff09;Mask RCNN总体流程 一.Mask RCNN 架构 自己整理了一份Mask RCNN架构图如下&#xff0c;其中绿色模块只有推理过程才会涉及。 核心模块包括&#xff1a;数据预处理&#xff0c;骨干网络&#xff0c;区域提议网络&#xff0c;FastRCNN分支&#xff0c…

【MATLAB】设置图形透明度

1 Scatter散点图 % 设置散点大小 s.SizeData 100;散点标记符号设置如下&#xff1a; 在绘制散点图时&#xff0c;想设置透明度&#xff1a; 更改散点透明度后&#xff0c;图形如下&#xff1a; 相关绘图代码如下&#xff1a; figure(1) set(gcf, Units, figureUnits, Po…

剪贴板管理软件 Paste Wizard mac中文版功能特色

Paste Wizard mac是一款剪贴板管理工具&#xff0c;它可以帮助用户更高效地管理剪贴板中的文本、图片、链接等内容。 Paste Wizard mac特色功能 提供了多种方式来保存和管理剪贴板中的内容。用户可以创建自定义的标签&#xff0c;将内容按照标签进行分类&#xff0c;方便快速查…

【RPC】前传

前传 本地程序用的go语言&#xff0c;想把main.go程序当中一些计算工作放到服务器上进行&#xff0c;而只需要把结果给我即可。由于平台上暂时不能运行Go代码&#xff0c;所以写的是python文件。 1、主要是使用ssh依赖进行连接&#xff0c;但是大概率是需要手动添加的&#xf…

android手机平板拓展电脑屏幕

有这么两个软件 spacedesk_driver_Win_10_64_v1065_BETA.msi 安装在电脑上 spacedeskv0.91.1_chinese.apk 安装在android设备上 同一个局域网投屏就好了。 局域网无限投屏是很吃带宽的。 建议usb共享网络&#xff0c;不占用带宽、延迟低。 下载地址&#xff1a; https:/…

OpenCV实现手势虚拟拖拽

前言&#xff1a; Hello大家好&#xff0c;我是Dream。 今天来学习一下如何使用OpenCV实现手势虚拟拖拽&#xff0c;欢迎大家一起前来探讨学习~ 一、主要步骤及库的功能介绍 1.主要步骤 要实现本次实验&#xff0c;主要步骤如下&#xff1a; 导入OpenCV库。通过OpenCV读取摄…

使用Drupal管理小型项目?试试Docker快速部署Drupal结合内网穿透实现远程访问

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525;个人专栏:《Linux深造日志》《C干货基地》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 文章目录 前言1. Docker安装Drupal2. 本地局域网访问3 . Linux 安装cpolar4. 配置Drupal公网访问地址5. 公网远程访问Drupal…

四川思维跳动商务信息咨询有限公司可信吗?

在今天的数字化时代&#xff0c;抖音带货已成为一种全新的商业模式。许多公司都在通过这种形式进行产品推广和销售&#xff0c;其中&#xff0c;四川思维跳动商务信息咨询有限公司以其专业的服务和良好的信誉&#xff0c;在抖音带货领域赢得了广泛赞誉。 四川思维跳动商务信息…

抖店怎么做才会快速起店?跟着这个思路来,一周搞定!

大家好&#xff0c;我是电商糖果 有不少朋友&#xff0c;自己开了一家抖店。 因为不懂运营&#xff0c;店铺一直没有流量&#xff0c;也不出单。 糖果做抖店三年多了&#xff0c;不敢自吹有多么优秀&#xff0c;但是做店还是有一套自己的方法的。 按照糖果这个思路做店&…

echarts 图表 地图实例

效果&#xff1a; 代码实现&#xff1a; draw(data) {var option {tooltip: {trigger: item,icon: query,// triggerOn: click,formatter: function (e, t, n) {let string ;string <div style"padding:10px"><span style"padding-right:10px"…

Microsoft SDKs 有文件重定义导致编译失败的处理

一个32位的mfc项目&#xff0c;之前采用vs2019编译&#xff0c;现在换了电脑(系统是win10)&#xff0c;采用vs2022编译时&#xff0c;提示如下错误&#xff1a; 1>------ 已启动生成: 项目: aAnsys, 配置: Debug Win32 ------ 1>cl : 命令行 warning D9035: “Gm”选项…

【ubuntu】ubuntu系统查看服务命令

查看正在运行的服务 sudo service --status-all [] 代表服务是在启动运行的状态 [-] 代表服务是在关闭停止的状态

使用Go语言抓取酒店价格数据的技术实现

目录 一、引言 二、准备工作 三、抓取数据 四、数据处理与存储 五、数据分析与可视化 六、结论与展望 一、引言 随着互联网的快速发展&#xff0c;酒店预订已经成为人们出行的重要环节。在选择酒店时&#xff0c;价格是消费者考虑的重要因素之一。因此&#xff0c;抓取酒…