【2023 · CANN训练营第一季】昇腾AI入门课(Pytorch)——第二章学习笔记

news2024/7/6 18:16:29

第二章 PyTorch模型迁移&调优

目标

  • 了解 Pytorch 是如何适配到昇腾平台上的
  • 了解 Davinci 硬件架构以及什么样的模型在昇腾上更亲和·了解软件术语和 Ascend - Pytorch 的安装步骤
  • 了解如何将原生 Pytorch 的模型代码是如何适配到 Ascend - Pytorch

前置知识

  • 对原生 Pytorch 的软件架构有一定了解.
  • 对昇腾芯片及 CANN 软件栈有一定了解·
  • 对原生 Pytorch的使用方法有一定了解·
  • 对混合精度训练有一定了解
    在这里插入图片描述
    在这里插入图片描述

软件架构及Ascend-Pytorch(1.8)安装

概念描述
CANN统一的异构计算框架,提供了计算能力
PTAdapter使Pytorch适配昇腾AI处理器系列的软件包
Driver+Firmware驱动包和固件包
A+X(Ascend+X86)昇腾卡+X86CPU的服务器形态
A+K(Ascend+KunPeng(ARM))昇腾卡+鲲鹏CPU的服务器形态

参考链接
https://www.hiascend.com/software/ai-frameworks
前提条件
1.已完成 CANN 开发或运行环境的安装,确保相应 os 依赖(如 python 、 numpy 等)已安装完成。
2.需确保 CMake >=3.12.0, gcc >=7.3.0
3.建议用户直接在安装环境中进行编译。如果在其他环境中编译,需要编译环境和安装环境的 OS 版本、依赖版本保持一致。
步骤:
1.安装依赖:pip3 install pyyaml wheel
2.安装官方 torch 包:-pip3 install torch ==1.8.1+ cpu
3.编译生成 pytorch 件的二进安装包。
git clone -- b maste https://gitee.com/ascend/pytorch.git

 -cd pytorch && bash ci / build . sh - python -3.7

4.安装插 torchnpu 包

-pip3 install - upgrade dist / torch _ npu -1.8.1- xooxwhl 

5.安装混合精度模块(可选)

-https://gitee.com/ascend/apex

Pytorch模型迁移——三种方法

  • 手工迁移
  • 脚本转换工具(msFmkTransplt)
  • 自动迁移(推荐)

Pytorch模型迁移——手工迁移
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
Pytorch模型迁移——脚本转换工具迁移
在这里插入图片描述
Pytorch模型迁移——自动迁移
在这里插入图片描述
在这里插入图片描述

本章总结

介绍了 Pytorch 在昇腾上的适配原理

  • 新增 npu 的 device 类型,开辟新的路径

  • 通过 npu 的 device 类型,结合适配层,调用 npu 底层计算能力

  • 通过适配 npu 上的内存管理和流管理机制等,使能任务运行

  • 通过适配 HCCL 通讯协议,使能分布式训练

介绍了芯片硬件架构及相应的影响
介绍了昇腾的软件栈及 Pytorch 的安装向导 PyTorch 模型迁移三种方法

  • 手工迁移(1.前期准备2.单 P 迁移3.多 P 迁移4.Debug)
  • 脚本转换工具迁移
  • transfer _ to _ npu 自动迁移(推荐)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422093.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

足够惊艳,使用Alpaca-Lora基于LLaMA(7B)二十分钟完成微调,效果比肩斯坦福羊驼

之前尝试了从0到1复现斯坦福羊驼(Stanford Alpaca 7B),Stanford Alpaca 是在 LLaMA 整个模型上微调,即对预训练模型中的所有参数都进行微调(full fine-tuning)。但该方法对于硬件成本要求仍然偏高且训练低效…

Java基础——IO流+字节流使用

(1)IO流的概述: IO流也称为输入,输出流,就是用来读写数据的。I表示input,是数据从硬盘文件读入到内存的过程,称之输入,负责读。O表示output,是内存程序的数据从内存到写…

CSS:transform顺序问题(translate()+rotate())

问题:下面两行代码在执行效果上有区别吗? transform: translate(100px,100px) rotate(45deg);transform: rotate(45deg) translate(100px,100px);translate(X,Y),可以使元素在x轴和y轴上平移。(在translate中,x轴右为…

设计模式之观察者模式(C++)

作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 一、观察者模式是什么? 观察者模式是一种行为型的软件设计模式,定义对象间的一种一对多的依赖关系&#x…

51 openEuler搭建PostgreSQL数据库服务器-安装、运行和卸载

文章目录51 openEuler搭建PostgreSQL数据库服务器-安装、运行和卸载51.1 安装51.2 运行51.2.1 初始化数据库51.2.2 启动数据库51.2.3 登录数据库51.2.4 配置数据库账号密码51.2.5 退出数据库51.2.6 停止数据库51.3 卸载51 openEuler搭建PostgreSQL数据库服务器-安装、运行和卸载…

【Webpack5】核心原理

介绍 本章节我们主要学习: loader 原理自定义常用 loaderplugin 原理自定义常用 plugin Loader 原理 loader 概念 帮助 webpack 将不同类型的文件转换为 webpack 可识别的模块。 loader 执行顺序 分类 pre: 前置 loadernormal: 普通 …

【golang项目-GeeCache】动手写分布式缓存 day1 - 实现LRU算法

介绍 LRU 内存淘汰算法 LRU(Least Recently Used) 最近最少使用 算法 ,系统认为如果这个数据最近使用过那么它被再次使用的概率会高,所以系统会先淘汰最久没被使用的数据 基本逻辑 -----------------------------------------------------------------…

手把手教你学习IEC104协议和编程实现 十一-定值的概念讲解、定值的操作过程以及部分代码的实现

从本章开始,我们开始研究定值部分; 定值是什么? 了解过终端的可能都知道,定值就是保护定值,就是设定了一组参数,当终端的采样值达到这个参数的时候,终端就会做出一系列的反应。这样的目的,是为了保护电网,让电网正常运行,具体为什么这么做,不做详细的解释,如果有…

李宏毅2021春季机器学习课程视频笔记13-自注意力机制

【(强推)李宏毅2021/2022春机器学习课程】 Slide地址 一、问题引入 1.模型的输入 无论是预测视频观看人数、视频处理、语言识别,这些所有的model中,输入数据都可以视作为一个向量(vector),模型的输出为一个数值或者一…

UDP的报文结构及注意事项

UDP的报文结构及注意事项🔎UDP的报文结构源端口和目的端口报文长度校验和🔎UDP的注意事项端口号报文长度校验和🔎结尾🔎UDP的报文结构 图片来自网络 源端口和目的端口 如果将 源IP 和 目的IP 看作是两台计算机在网络中的地址 那么…

完美解决丨#在python中,如果引用的变量未定义,则会报告NameError: name ‘变量名‘ is not defined。

NameError 在python中,如果引用的变量未定义,则会报告NameError: name 变量名 is not defined。 如下代码抛出了一个异常: !/usr/bin/env python -- coding:utf-8 -- print hello world print hello %s % name 报错信息如下: Trac…

基于springboot和ajax的简单项目 02 代码部分实现,思路 (上)

01.由于是对功能的实现&#xff0c;应该是按照功能的需要去写代码&#xff0c;所以&#xff0c;先看前端html文件的代码。 02.项目的开始界面是starter.html文件。 关键的script标签 <script type"text/javascript">$(function(){//页面加载完成之后执行doLo…

VS中解决方案和项目的区别

总目录 文章目录总目录一、概述1、解决方案2、项目3、项目文件4、解决方案文件夹二、图解1、图解解决方案和项目的关系2、图解sln文件3、图解项目文件结语一、概述 1、解决方案 解决方案是一个容器&#xff0c;通常包含多个项目&#xff0c;这些项目通常相互引用。 解决方案中…

CSDN粉丝首破一千关,有你名字

2023-4-11&#xff0c;CSDN粉丝首破一千关。 感谢词版本1,哈哈哈哈哈哈哈哈 在编程世界里&#xff0c;人们可以像创造生命一样创造程序&#xff0c;而我对这种创造和创新的热情&#xff0c;从我的csdn博客社区粉丝首次突破一千人的消息中得到了极大的满足和激励。作为一个Pyth…

Spring中Bean初始化和销毁的多种方式

Spring中Bean初始化和销毁的多种方式一、Bean的多种初始化方式1.PostConstruct注解2.实现InitializingBean接口3.声明init-method方法二、Bean的多种销毁方式1.PreDestroy注解2.实现DisposableBean接口3.声明destroy-method方法三、总结Spring中支持在Bean的加载时声明初始化方…

跑得快的不止是程序丄【掌握自动化测试让你过五关斩六将】

拥有自动化测试技能的软件测试人员更具竞争力&#xff0c;这是当下面试过的人都非常认同的一句话。 作为一名软件测试人员&#xff0c;我们都知道“时间就是金钱”&#xff0c;尤其是在快速迭代的敏捷开发模式下&#xff0c;更是如此。在传统的软件测试流程中&#xff0c;手工…

【MySQL】JDBC编程

摄影分享 目录 数据库编程的必备条件 Java的数据库编程&#xff1a;JDBC JDBC的使用步骤 1. 创建数据源DataSourece 2.连接数据库 3.构造并执行sql语句 4.遍历结果集合 5.释放资源 数据库编程的必备条件 编程语言&#xff0c;如Java&#xff0c;C、C、Python等数据库&am…

谁说35岁是程序员的中年危机?那是他还不知道这些新路子

文章目录一、年纪大能不能进大厂&#xff1f;二、为什么说35是危机&#xff1f;1.精力衰退2.脑力衰退3.知识/技术迭代三、年龄大的程序员有哪些出路&#xff1f;1.技术管理2.创业3.技术外包4.做老师5.做自媒体6.写书四、结语我自己今年已有44了&#xff0c;从2021年开始就已经不…

详解自动化测试之 Selenium 与 Junit

文章目录1. 什么是自动化2. 自动化测试的分类3. selenium&#xff08;web 自动化测试工具&#xff09;4. 一个简单的自动化例子5. selenium 常用方法5.1 查找页面元素 findElement ()5.2 元素的定位 By 类5.3 xpath 路径语言6. 常见的元素操作6.1 输入文本 sendKeys6.2 点击 cl…

什么是Android FrameWork,请你介绍一下?

Framework是什么 Framework的中文意思是“框架”&#xff0c;在软件开发中通常指开发框架&#xff0c;在一个系统中处于内核层之上&#xff0c;为顶层应用提供接口&#xff0c;被设计用来帮助开发者快速开发顶层应用&#xff0c;而不必关心系统内核运行机制&#xff0c;通常Fr…