华为昇腾NPU卡 ChatGLM2模型使用

news2025/2/26 5:57:56

参考:https://gitee.com/mindspore/mindformers/blob/dev/docs/model_cards/glm2.md#chatglm2-6b

1、安装环境:

昇腾NPU卡对应英伟达GPU卡,CANN对应CUDA底层; mindspore对应pytorch;mindformers对应transformers

本次环境:
CANN-6.3.RC2.b20231016
mindspore 2.0.0
mindformers (离线安装:https://gitee.com/mindspore/mindformers)
在这里插入图片描述

在这里插入图片描述
查看npu使用信息:

npu-smi info

在这里插入图片描述

2、ChatGLM2模型使用

参考:https://gitee.com/mindspore/mindformers/blob/dev/docs/model_cards/glm2.md

问题参考:
https://gitee.com/mindspore/mindformers/issues/I897LA#note_22105999

代码:

1)pipline方式运行:

import os
import mindspore as ms


os.environ['DEVICE_ID']='0'
ms.set_context(mode=ms.GRAPH_MODE, device_target="Ascend", device_id=0)  ##需要使用才能npu加速


from mindformers import pipeline, TextGenerationPipeline

task_pipeline = pipeline(task='text_generation', model='glm2_6b', max_length=2048)  ##模型自动会下载到checkpoint_download文件夹下

task_pipeline('你好') ## 第一次很慢,加载编译阶段
task_pipeline('写一首关于一带一路的诗') ##第二次开始速度才有提升

在这里插入图片描述

由于mindspore不支持一张卡上运行多个任务,所以启动任务都是直接默认申请31G显存占用的,挺耗资源
在这里插入图片描述
2)接口运行

import os
import mindspore as ms

os.environ['DEVICE_ID']='0'
ms.set_context(mode=ms.GRAPH_MODE, device_target="Ascend",device_id=0)

from mindformers import AutoConfig, AutoModel, AutoTokenizer



tokenizer = AutoTokenizer.from_pretrained("glm2_6b")

config = AutoConfig.from_pretrained("glm2_6b")
config.use_past = True
model = AutoModel.from_config(config)


##第一轮问问题
inputs = tokenizer("你好")["input_ids"]
# print(inputs)
outputs = model.generate(inputs, max_new_tokens=20, do_sample=True, top_k=3)

response = tokenizer.decode(outputs)
print(response)



第一轮加载编译还是很慢,后续速度才提升

##第二轮问问题
inputs = tokenizer("写一首一带一路的诗")["input_ids"]
# print(inputs)
outputs = model.generate(inputs, max_new_tokens=500, do_sample=True, top_k=3)
response = tokenizer.decode(outputs)
print(response)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1126689.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第1章 Java、IDEA环境部署与配置

JavaEE简介与IDE环境部署 课程目录 JavaEE简介JDK环境部署IntelliJ IDEA环境部署 JavaEE简介 1. JavaEE是什么? Java EE(Java Platform,Enterprise Edition)是sun公司(2009年4月20日甲骨文将其收购)推…

QGIS007:【01空间操作】-提取两个图层空间相交属性一致的图斑

引言:本文介绍使用QGIS图形建模器设计模型,提取出两个图层空间位置存在交集且字段(NAME;LAYER)属性值完全一致的要素。 实验数据: 链接:https://pan.baidu.com/s/1qqylXkqzRFNnKK-pRQNkMg?pwdurzx 提取码…

AlDente Pro for Mac: 掌控电池充电的终极解决方案

你是否曾经为了保护你的MacBook的电池,而苦恼于无法控制它的充电速度?AlDente Pro for Mac 是一款专为Mac用户设计的电池管理工具,它能帮助你解决这个问题。 AlDente Pro for Mac 是一款电池最大充电限制软件,它能够让你自由地设…

深度学习_4_实战_直线最优解

梯度 实战 代码: # %matplotlib inline import random import torch import matplotlib.pyplot as plt # from d21 import torch as d21def synthetic_data(w, b, num_examples):"""生成 Y XW b 噪声。"""X torch.normal(0,…

Qcom查看算法库编译工具版本的方法

一,简介 本文主要介绍如何查看使用Hexagon IDE编译出来的算法库使用的是哪个版本的clang version,供相关开发人员进行参考。 二,操作步骤 使用notepad打开编译生成的算法库,搜索“LLVM Hexagon Clang version” 如下所示&#…

Qt中QPushButton、QAction等信号clicked()和toggled()的区别及setCheckable()和setChecked()区别

在Qt中,QPushButton(按钮)有两个常用的信号:clicked()和toggled(bool checked)。这两个信号在按钮的状态改变时都会发出,但是它们之间有一些重要的区别: clicked() 信号: clicked() 信号在按钮…

untiy 新输入系统 InputSytem

文章目录 一 前言二 安装新建一个输入资产三 InputActions面板区域1 工具栏controlSchemes 控制方案saveAsset和Auto-Save 区域2 actionMaps 动作映射集区域3 actions 区域4 属性面板1 action与bingding的创建与删除2 action的属性3 Bindin属性4 实例演示,创建一个跳…

最详细STM32,cubeMX 超声波测距

这篇文章将详细介绍 STM32使用 cubeMX驱动超声波测距 。 文章目录 前言一、超声波模块测距原理 : 二、cubeMX 配置三、实验程序总结 前言 实验材料:STM32F103C8T6开发板, HC-SR04 超声波模块。所需软件:keil5 , cubeM…

二叉搜索树进阶--AVL树详细实现过程

目录 AVL树概念AVL树实现AVL树基础结构插入插入:左旋实现插入:右旋实现 AVL树完整实现代码: 之前学习到的二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中…

【C语言】popen()函数详解

popen函数详解 一、函数介绍二、使用实例 一、函数介绍 头文件#include <stdio.h>函数原型FILE *popen(const char *command, const char *type); 功能&#xff1a;popen()函数通过先创建一个管道&#xff0c;然后调用 fork 产生一个子进程&#xff0c;让子进程执行shel…

nvm的安装,使用及命令

nvm的安装&#xff0c;使用及命令 nvm工具1.nvm的安装基于node的开发nvm是什么nvm下载nvm安装 2.nvm的命令3.nvm的使用 nvm工具 nvm是什么 nvm下载与安装 nvm的基本使用1.nvm的安装 基于node的开发 在介绍nvm之前&#xff0c;先介绍下前端开发中关于node的使用。目前前端不管…

Allegro如何交换两个器件的位置操作指导

Allegro如何交换两个器件的位置操作指导 在用Allegro进行PCB设计的时候,交换两个器件的位置是使用的十分频繁的操作,如下图 需要将两个器件的位置交换,可以手动移动,然后交换下位置,但是Allegro支持快速将两个器件的位置对调 具体操作如下 点击Place点击Swap

【Javascript】数组练习(将字符串“ab,cd,ef,gh“转化成数组,并且删除“cd“)

将字符串"ab,cd,ef,gh"转化成数组&#xff0c;并且删除"cd“ var strab , cd , ef , gh; 调用split函数将字符串转化为数组 var strab , cd , ef , gh;var liststr.split(,);console.log(list); 调用splice方法在数组中删除cd var strab , cd , ef , gh;var …

TCP通信实战案例-模拟BS系统[了解]

前言 1、之前的客户端都是什么样的&#xff1f; 其实就是CS架构&#xff0c;客户端实需要我们自己开发实现的。 2、BS结构是什么样的&#xff0c;需要开发客户端吗&#xff1f; 浏览器访问服务端&#xff0c;不需要开发客户端。 实现BS开发 注意&#xff1a;服务器必须给浏…

C++左值引用与右值引用

0.类型和值类别的区别&#xff1f; 类型&#xff08;type&#xff09;和值类别&#xff08;value category&#xff09; 1.类型指的是数据类型&#xff0c;int&#xff0c;char这样的内置类型&#xff0c;类型主要是用来区别它们的字节大小。除了内置类型还有自定义类型&…

前端构建但没有更新

使用jenkins构建vue前端代码时&#xff0c;构建完成后&#xff0c;jenkins提示构建成功&#xff0c; 但前端刷新提示还是原来的效果&#xff0c;此时需要查看下jenkins构建日志&#xff0c;如果出现下面的文字&#xff0c;说明缺少依赖&#xff0c;最新的代码并没有构建到项目中…

QT-opengl编译错误

问题1&#xff1a; QT编译错误&#xff1a;undefined reference to __imp_gl* 解决方案 在工程*.pro文件中加入 win32:LIBS -lOpengl32 \-lglu32 win32-msvc{LIBS opengl32.lib \glu32.lib \glut.lib}问题2&#xff1a; 解决方案&#xff1a; 改变变量名称&#xff1a; 改…

WebSocket—STOMP详解(官方原版)

WebSocket协议定义了两种类型的消息&#xff08;文本和二进制&#xff09;&#xff0c;但其内容未作定义。该协议定义了一种机制&#xff0c;供客户端和服务器协商在WebSocket之上使用的子协议&#xff08;即更高级别的消息传递协议&#xff09;&#xff0c;以定义各自可以发送…

VM虚拟机 13.5 for Mac

VMware Fusion Pro for Mac是一款强大的虚拟机软件&#xff0c;可以在Mac操作系统中创建、运行和管理多个虚拟机&#xff0c;使用户可以在一台Mac电脑上同时运行多个操作系统和应用程序。 以下是VMware Fusion Pro for Mac的主要特点&#xff1a; 1. 支持多种操作系统&#xff…

CC攻击演示

选择一个代参数网站 未攻击前的cpu 用工具进行CC攻击 执行攻击会把目标主机占用内存&#xff0c;可以在把次数加大一点