pytorch的安装【全官网流程】

news2024/10/5 12:30:22
1.准备python环境

python环境需要看pytorch上说明的版本本文用的是python3.9

conda create -n pytorch39 python=3.9
2.安装pytorch【要使用GPU的先安装步骤3的CUDA在安装这个】

pytorch官方地址

(1)官方指出了python版本:
在这里插入图片描述

(2)使用
在这里插入图片描述
选择自己的环境,如果不用GPU的话直接选择CPU复制最后一行的pip命令在python环境下的cmd窗口运行安装完后就可以了。

3.需要使用GPU
3.1 安装cuda

随着显卡的发展,GPU越来越强大,而且GPU为显示图像做了优化。在计算上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像渲染和计算以外的目的(例如这里提到的通用并行计算)。CUDA即Compute Unified Device Architecture,是NVidia利用GPU平台进行通用并行计算的一种架构,它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以利用C言、OpenCL、Fortran、c++等为CUDA架构编写程序。简单来理解,cuda就是NVidia提供的可以将显卡进行并行运算的一种软件驱动。

我们的最终目标是使用Pytoch,而特定Pytorch对cuda的版本是有要求的。因此,我们在安装cuda之前需要先确认到底装哪个cuda版本才行。
(1) 查看显卡的驱动版本

nvidia-smi

在这里插入图片描述
驱动版本是Driver Version: 537.58-------------------CUDA Version: 12.2
我们需要安装的CUDA版本应该是12.2,也可以参考官网的表因为截图迟早都不会是最新的文章,但是官网肯定会实时更新。
官网CUDA安装版本和N卡驱动对照表
在这里插入图片描述
我们还可以在官网看到不同型号的显卡的算力,我们这里是GeForce RTX 3050
在这里插入图片描述
所以在nvidia的gpu官网可以看到我们的显卡算力
在这里插入图片描述
根据自己的显卡型号点击不同的栏目查看

最后下载我们对应的CUDA在CUDA Toolkit官网选择自己的操作系统和CUDA版本下载,如果没有对应的版本点击CUDA Documentation/Release Notes查看其它版本
在这里插入图片描述
下载好以后安装CUDA

按照安装提示默认安装即可。 安装完成后,可以打开文件夹C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA,可以看到当前目录已经存在v12.2文件夹,表示已经成功安装cudav12.2版本,并且上述安装程序已经自动的向环境变量中添加了对应的cuda路径,使得后续pytorch可以正常调用和执行。

最后,测试一下cuda是否安装成功。打开cmd命令终端,然后输入命令:

nvcc -V

在这里插入图片描述

3.2 安装cudnn (可以不安装)

cudnn是什么?为什么装了cuda了还要再装cudnn?

为了解释上述两个问题,我们需要重新梳理一下我们使用Pytorch的最终目标是什么?我们是用它来进行深度学习训练和推理,深度学习本质上就是训练深度卷积神经网络。尽管我们已经可以用cuda使得显卡来完成并行计算任务,但是所有的操作还是比较底层的、复杂的。是否在cuda之上有一个专门用于深度神经网络的SDK库来加速完成相关特定的深度学习操作,这个库就是cudnn。

NVIDIA cuDNN是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。NVIDIA cuDNN可以集成到更高级别的机器学习框架中,如caffe、tensorflow、pytorch、mxnet等。cudnn简单的插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是调整性能,同时还可以在GPU上实现高性能现代并行计算。

简单来说,cuda就是用来定义显卡并行运算的一些列底层GPU操作库,cudnn则是在cuda基础上专门正对深度学习定制的高级GPU操作库。

cudnn官网下载地址
这里需要注册账号并填写相关个人信息,然后进才可以进入真正的下载页面,按照提示一步步操作,最终在下载页下载自己对应的版本。我们选择的cuDNN v8.9.5,没有对应CUDA版本的选择绿色的其它版本。
在这里插入图片描述

在这里插入图片描述
下载之后,解压缩,将CUDNN压缩包里面的bin、clude、lib文件直接复制到CUDA的安装目录下(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2),直接覆盖安装即可完成。

4.验证

验证Pytorch是否安装成功并且能够成功调用cudnn。首先在命令行中输入python进入python环境,然后输入命令:

import torch 
print(torch.__version__)

如下图所示说明pytorch已经安装成功
在这里插入图片描述
再验证pytorch调用cuda是否正确。输入命令:

print(torch.cuda.is_available())

如下图所示即为成功:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1107111.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信私域怎么高效转化?看看这款系统!

在今天的数字化时代,私域流量已经成为企业与个人创业者获取竞争优势的重要手段。而微信作为中国最大的社交平台之一,其私域流量的价值不言而喻。那么,如何才能轻松玩转微信私域流量呢?接下来,我们将为你介绍一款强大的…

设计模式:抽象工厂模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)

大家好!本节主要介绍设计模式中的抽象工厂模式。 简介: 抽象工厂模式,它是所有形态的工厂模式中最为抽象和最具一般性的一种形态。它用于处理当有多个抽象角色时的情况。抽象工厂模式可以向客户端提供一个接口,使客户端在不必指…

TCP/IP(十九)TCP 实战抓包分析(三)TCP 第一次握手 SYN 丢包

一 TCP 三次握手异常情况实战分析 说明: 本文是TCP 三次握手异常系列之一 ① 异常场景 接下里我用三个实验案例,带大家一起探究探究这三种异常关注: 如何刻意练习模拟上述场景 以及 wireshark现象 ② 实验环境 ③ 实验一:TCP 第一次握…

STM32F407在RAM中执行程序

STM32F407在flash中执行代码的速度比在ram中执行代码的速度快。因为STM32F407有一颗“自适应实时存储器加速器”,这里不讨论ART Accelerator的加速方案。 把代码放在RAM中执行纯粹是为了学习。 将个别函数的代码放到RAM中运行 使用自己编写的链接脚本(sct文件)。 …

《论文阅读28》OGMM

一、论文 研究领域: 点云配准 | 有监督 部分重叠论文:Overlap-guided Gaussian Mixture Models for Point Cloud Registration WACV 2023 二、概述 概率3D点云配准方法在克服噪声、异常值和密度变化方面表现出有竞争力的性能。本文将点云对的配准问题…

【计算机网络原理】初始网络基础

文章目录 1. 网络发展史1.1 单机时代1.2 网络互连局域网 LAN广域网 WAN 2. 网络通信基础2.1 IP 地址2.2 端口号2.3 协议2.4 五元组2.5 协议分层2.5.1 OSI七层模型2.5.2 TCP/IP五层模型 2.6 封装和分用2.6.1 数据封装(发送方情况)2.6.2 数据分用(接收方情况) 总结 1. 网络发展史…

这是不是你们都在找的免费又好用的配音网站?

随着人工智能技术的不断发展和普及,AI配音软件也越来越多地进入人们的视野。它可以帮助我们快速地将文字转换成语音,让我们的工作变得更加高效和便捷。在本文中,我将介绍一款非常实用而且免费的AI配音网站,超级简单好用&#xff0…

C++string的使用

CSDN的uu们,大家好。这里是C入门的第十六讲。 座右铭:前路坎坷,披荆斩棘,扶摇直上。 博客主页: 姬如祎 收录专栏:C专题 目录 1.构造函数 1.1 string() 1.2 string(const char* s) 1.3 string(const …

Cinema 4D云渲染一分钟动画要多少钱?如何进行Cinema 4D云渲染?看完就懂了

1.为什么Cinema 4D要使用云渲染? 近年来,Cinema 4D在实现视觉效果方面取得了很大的进展。但是,随着视觉效果的复杂化,渲染的工作量也相应增加,导致渲染时间变长。在这种情况下,云渲染平台就能…

Linux嵌入式系统开发之路:从小白到大牛

💂 个人网站:【工具大全】【游戏大全】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 嵌入式系统开发是一个充…

Spring framework Day22:Aware接口

前言 在Spring框架中,有许多接口和类都有一个非常重要的作用——让我们能够更方便地构建应用程序和管理组件。其中,Aware接口就是其中一个非常重要的接口之一。通过实现该接口,我们可以让Spring容器感知到特定的组件和资源,并进行…

媒体转码和输出软件:Media Encoder 2024中文版

想要高效地转码、优化输出吗?那就来尝试全新的Media Encoder 2024吧!Media Encoder是Adobe公司出品的一款媒体转码和输出软件,可以帮助您快速、高效地将多种格式的视频和音频转换为所需的输出格式。 全新的Media Encoder 2024提供了更加智能…

【CANoe】XML Test Module使用实例

文章目录 一、实操步骤1、增加XML Test Module节点2、配置XML Test Module节点3、XML Test Module节点增加CAPL脚本(.can文件)4、文件夹结构5、使用仿真节点开始测试6、测试结果与测试报告7、同理,在Test Setup也可如此操作 一、实操步骤 1、增加XML Test Module节…

使用conda install一直卡在solving environment的解决方法

使用国内镜像源,但install仍旧一直卡在solving environment,超过10分钟就不用等了; 检查C:\Users\UserName 路径下的.condarc文件 将这个defaults这一行删掉即可

【Linux-常用命令-基础命令-复制-copy-命令-笔记】

【Linux-常用命令-基础命令-复制文件-copy-命令-笔记】 1、前言2、操作3、自己的实践 1、前言 最近,在使用Linux的时,使用相关基础命令是,总是容易忘记,上网一搜,大部分都写的比较繁琐,我就找下复制命令&a…

【算法设计与分析qwl】04 NP-hard——只是举例几个,货郎,双机调度,01背包

NP-hard问题: 有效算法是 输入规模的多项式时间算法。 这些问题的难度处于可有效计算的边界。 算法数据结构程序设计 例4 货郎问题 建模与算法: 解是一个排列, 0-1背包问题: 建模: 双机调度: 建模&#x…

【PPT技巧】如何将多张幻灯片打印在一张纸上?

PPT页面很多,想在打印的时候,多张幻灯片放置在同一页面,也就是打印在一张纸上,如何设置呢? 首先,打开需要打印的PPT文件,点击菜单选项卡【文件】,然后在弹出的页面中点击【打印】选…

单链表经典OJ题:找出链表的中间节点

题目: 给你单链表的头结点 head ,请你找出并返回链表的中间结点。如果有两个中间结点,则返回第二个中间结点。 图例: 解法: 解法1: 先遍历链表确定链表节点的数量,然后再找到中间位置的节点 解法2: 快慢…

Linux性能优化--补充

14.1. 性能工具的位置 本书描述的性能工具来源于Internet上许多不同的位置。幸运的是,大多数主要发行版都把它们放在一起,包含在了其发行版的当前版本中。表A-1描述了全部工具,提供了指向其原始源位置的地址,并注明它们是否包含在…

百度地图高级进阶开发:圆形区域周边搜索地图监听事件(覆盖物重叠显示层级\图像标注监听事件、setZIndex和setTop方法)

百度地图API 使用百度地图API添加多覆盖物渲染时,会出现覆盖物被相互覆盖而导致都无法触发它们自己的监听;在百度地图API里,map的z-index为0,但是触发任意覆盖物的监听如click时也必定会触发map的监听; 项目需求 在…