Pytorch安装 CUDA Driver、CUDA Runtime、CUDA Toolkit、nvcc、cuDNN解释与辨析

news2024/9/22 15:38:21

Pytorch的CPU版本与GPU版本

Pytorch的CPU版本

  • 仅在 CPU 上运行,适用于没有显卡或仅使用 CPU 的机器。
  • 安装方式相对简单,无需额外配置 CUDA 或 GPU 驱动程序。
  • 使用方式与 GPU 版相同,唯一不同的是计算将自动在 CPU 上进行。

Pytorch的GPU版本

  • 在 NVIDIA GPU 上运行,充分利用 CUDA(Compute Unified Device Architecture)进行加速。
  • 安装时需要确保 NVIDIA 的 CUDA 和 cuDNN 版本兼容。

如何确定使用哪个版本?

在电脑中使用快捷键windows+X,选择设备管理器查看,如果有NVIDIA的显卡,则可以使用GPU版本。

有NVIDIA显卡的情况下也可以使用CPU版本,但是没有NVIDIA显卡则只能使用CPU版本,如果可以使用GPU版本的话,推荐优先使用GPU版本,因为具有更好的性能与更快的速度。

CUDA Driver、CUDA Runtime、CUDA Toolkit、nvcc、cuDNN解释与辨析

在电脑拥有NVIDIA显卡的情况下,安装GPU版本之前,可以先查看自己的CUDA版本。

通过命令行窗口输入nvidia-smi可以查看。

现在显示出的CUDA Version,具体来说其实是CUDA Driver Version即CUDA驱动的版本,与其对应的还有CUDA Driver、CUDA Runtime、CUDA Toolkit、nvcc、cuDNN,这几个概念之间有以下的关系。

CUDA Driver

CUDA Driver(CUDA驱动程序)管理CUDA应用程序在GPU上的执行,它使CUDA应用程序与GPU硬件之间进行交互。

CUDA Runtime

CUDA Runtime是NVIDIA提供的一个软件层,它为开发人员提供了一个高层次的接口,以便更方便地使用CUDA进行GPU编程。CUDA Runtime封装了许多底层的CUDA驱动程序功能,使得开发者可以更加专注于算法和应用程序的开发,而不必深入底层的硬件细节。

CUDA Toolkit

CUDA Toolkit是NVIDIA提供的一套开发工具和库,旨在帮助开发人员创建和优化基于CUDA的应用程序。它包括了包括NVIDIA的CUDA编译器(nvcc)、CUDA程序库、CUDA开发工具。安装CUDA Toolkit时,通常也会携带安装CUDA Driver。

nvcc

nvcc(NVIDIA CUDA Compiler)是NVIDIA提供的CUDA编译器,用于将CUDA代码编译成可在NVIDIA GPU上运行的二进制文件。它是CUDA Toolkit的一部分,专门设计用于处理CUDA C/C++代码,并将其与常规C/C++代码结合编译。

cuDNN

cuDNN(CUDA Deep Neural Network library)是NVIDIA提供的一个高性能深度学习库,专门为深度神经网络(DNN)的训练和推理优化,旨在利用NVIDIA GPU的计算能力来加速深度学习任务。

他们之间有什么联系?

在有Nvidia显卡的电脑上,通常会直接自带有CUDA Driver,因为显卡的正常使用就依赖于CUDA Driver,且通过nvidia-smi命令查询到的CUDA Version就是指的CUDA Driver的版本。但是在对原始电脑不做其他操作的情况下,通过nvcc -V命令是会执行报错的,因为电脑中只有CUDA Driver,并没有安装CUDA Runtime的环境,此条命令查询是CUDA编译器nvcc的版本信息,由于nvcc是被包括在CUDA Runtime中的,没有CUDA Runtime自然也就查询不到nvcc的信息。如果要对CUDA Runtime的环境进行安装,就需要安装CUDA Toolkit, 安装CUDA Toolkit时选择的版本就对应了CUDA Runtime的版本,因为CUDA Toolkit的版本和CUDA Runtime的版本是一致的,同时安装CUDA Toolkit时也会携带安装一个与当前版本最佳兼容的一个版本的CUDA Driver,如果安装时检测到系统已有CUDA Driver,安装程序可能会检测到现有版本并提示保留或更新。在使用深度学习框架需要进行加速训练时,可以使用到cuDNN,它是一个独立的库,不随CUDA Toolkit安装需要单独下载,但需要配合CUDA Toolkit使用,所以使用cuDNN前需要先安装好CUDA Toolkit,当然如果不使用cuDNN也是可以正常使用Pytorch的。

在安装Pytorch时很多博客中首先记录了对CUDA Toolkit的安装,但这一步是必须的吗?

下面针对CUDA Toolkit与Pytorch的安装关系进行一些说明。

下载Pytorch时通常会附带下载CUDA Toolkit,该CUDA Toolkit作为附带下载的并不带有完整的功能,只有支持Pytorch工作的部分。具体而言,下载Pytroch时附带下载的CUDA Toolkit没有携带驱动程序(CUDA Driver)也没有携带编译工具(nvcc),但它会有供Pytorch功能使用的已经编译好的CUDA函数库,这些编译完成的库函数可以不用再进行编译而直接运行,其CUDA版本号表示的是编译这些CUDA函数库时使用的CUDA Runtime版本,与电脑本机具体使用的CUDA Runtime版本无关,因此本地电脑安装Pytorch时其实不安装CUDA编译工具(nvcc)也可以正常使用,只要保证CUDA Driver存在(nvidia-smi能够查看到)且版本大于大于下载Pytorch时选择的CUDA版本(即附带的CUDA Toolkit中携带的已编译的函数库在编译时的CUDA Runtime版本)。当使用到nvcc编译器的编译功能时,Pytorch附带的CUDA Toolkit功能不够用了,此时才需要对完整的CUDA Toolkit进行下载。

综上所述,可以得出以下结论:

在电脑自带有CUDA Driver的情况下,如果不编写自定义的CUDA扩展或修改PyTorch的底层实现,只使用Pytorch的预编译版本,那么可以不需要去对CUDA Toolkit进行安装,只需要选择与自己电脑上的CUDA Driver版本匹配的Pytorch版本即可。

当使用Pytorch的过程中需要用到cnDNN进行加速时,或是需要编写自定义的CUDA扩展或修改PyTorch的底层实现时,则必须要安装CUDA Toolkit

以上概念辨析参考 图文并茂讲解CUDA, CUDA Toolkit, CUDA Driver, CUDA Runtime, nvcc之间的关系及其版本兼容性-CSDN博客

CUDA版本说明

图文来源 23. GPU版本-GPU与CUDA准备工作_哔哩哔哩_bilibili

在安装Pytorch的GPU版本时,必须要选择的就是对应的CUDA版本,而这个CUDA版本指的就是CUDA Runtime Version,即CUDA运行时的版本,这个版本必须要低于或等于本机的CUDA驱动的版本,即CUDA Driver Version,也即通过nvidia-smi命令查询得到的版本,否则会出现低版本无法兼容高版本的情况。

在确定好本机的CUDA Driver Version后,即可安装对应的CUDA Runtime Version的Pytorch版本。若要安装的Pytorch版本对于CUDA Runtime Version的要求高于本机的CUDA Driver Version,可以选择对本机的CUDA Driver Version进行升级,即下载高版本的驱动来更新本机的驱动版本,或是直接安装CUDA Toolkit来顺带更新驱动。

对于更新驱动与CUDA Toolkit安装的操作可以参考 NVIDIA驱动程序(NVIDIA Driver)和CUDA Toolkit安装_nvidia cuda toolkit-CSDN博客

Pytorch安装

明确了CUDA中的各个概念与版本选择,下面可以自信地安装自己合适版本的Pyorch了。

前往官网 PyTorch

当前展示的是最新版本,如果需要早期版本的可以点击下方的标签查看。

由于我需要下载的是1.13.0的版本,所以翻到了这个地方。

此时查看本机的CUDA Driver版本为11.7.

根据前文描述的版本选择要求,可以选择其中的pytorch-cuda=11.7的版本,将命令复制后输入到命令行中即可开始下载。

安装完成后可以查看是否成功安装。

当能够import不报错时表示安装成功了,当查询torch.cuda.is_available()为true时表示能够使用GPU。

需要注意的是,当前安装Pytorch的过程中我都是没有去另外安装CUDA Toolkit的,本机只存在CUDA Driver,而没有CUDA Runtime,所以当前的Pytorch功能的使用都是基于其自带的预编译好的CUDA程序,如果有编写自定义的CUDA扩展或修改PyTorch的底层实现的需求,或是需要使用cuDNN,则需要去安装CUDA Toolkit。

CUDA Toolkit安装

按上文所述,如果没有使用cuDNN的需求,Pytorch此时就可以直接进行使用了。但如果要使用cuDNN,则需要去先安装CUDA Toolkit,因为cuDNN的使用依赖于CUDA Toolkit。所以首先进行CUDA Toolkit的下载安装。

各版本下载地址 CUDA Toolkit Archive | NVIDIA Developer

对于版本的选择,只要比本机的CUDA Driver版本低即可,可以和要安装的Pytorch对应的CUDA版本一致,我的电脑中CUDA Driver为11.7(通过nvidia-smi查询),所以选择安装11.6的版本。

以上操作细节参考 CUDA与cuDNN安装教程(超详细)-CSDN博客

cuDNN安装

前往官网下载 cuDNN Archive | NVIDIA Developer 可以挑选自己的cuda对应的版本下载

通常需要注册,直接注册即可。

 具体操作细节参考 CUDA与cuDNN安装教程(超详细)-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2102739.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VBA学习(63):Excel VBA 数据分析展示/ListView控件/Combox组合框控件/CheckBox复选框控件/科目汇总表

前面我们分享了使用ListVeiw进行数据展示,做出“科目汇总表”来(Excel VBA 数据分析展示/ListView控件、Excel VBA 数据分析展示/ListView控件/Combox组合框控件/科目汇总表(2)),今天,我们继续完善按月查询、按一级科目…

codesys进行控制虚拟轴运动时出现的一些奇怪bug的解释

codesys进行控制虚拟轴运动时出现的一些奇怪bug的解释 问题描述第一个奇怪的bug:新建的工程没有SoftMotion General Axis Pool选项第二个奇怪的bug:在新建工程SoftMotion General Axis Pool选项时,无法手动添加第三个奇怪的bug:虚…

Spring源码之refresh

1.refesh的核心介绍 在 Spring 框架中,refresh 主要用于刷新应用上下文。这一过程涉及多个重要的步骤,确保 Spring 容器的状态更新、bean 的加载以及资源的初始化。 refresh 方法的主要功能 初始化上下文: refresh 方法会初始化应用上下文&…

【项目实战】智能机械臂协同视觉辅助仓储物流管控平台

写在前面: 🌟 欢迎光临 清流君 的博客小天地,这里是我分享技术与心得的温馨角落。📝 个人主页:清流君_CSDN博客,期待与您一同探索 移动机器人 领域的无限可能。 🔍 本文系 清流君 原创之作&…

9月4日星期三今日早报简报微语报早读

9月4日星期三,农历八月初二,早报微语早读。 1、全球第二批100个地质遗产地公布,中国乌海、自贡、桂林等3地入选; 2、我国科学家在超高纯石墨领域取得重大突破; 3、2024上海百强企业榜单发布:入围门槛105…

小土堆pytorch

anaconda安装 pip list 可以看有哪些package包 nvidia-smi查看显卡的状态 安装pytorch 检验pytorch是否安装成功,以及是否pytorch是否可以使用gpu。 (1)查看conda版本 conda --version 或 conda -V (2)更新conda(将conda自身更新到最新版本) …

算法打卡 Day28(回溯算法)-组合总数 + 组合总数 Ⅱ+ 电话号码的字母组合

文章目录 Leetcode 17-电话号码的字母组合题目描述解题思路 Leetcode 39-组合总数题目描述解题思路 Leetcode 216-组合总数 Ⅲ题目描述解题思路 Leetcode 17-电话号码的字母组合 题目描述 https://leetcode.cn/problems/letter-combinations-of-a-phone-number/description/ …

Flink问题记录

尚硅谷Flink1.17问题记录 上手pom依赖循环递归WordCountStreamDemo中readTextFile是deprecated&#xff08;强烈反对的&#xff09; 上手 pom依赖循环递归 pom依赖中&#xff1a; <dependency><groupId>org.apache.flink</groupId><artifactId>flink…

J.U.C Review - 线程池原理/源码解析

文章目录 为什么要使用线程池ThreadPoolExecutor构造方法解析常见的阻塞队列实现及其特性阻塞队列在实际应用中的适用场景分析自定义ThreadFactory和RejectedExecutionHandler实际使用中的示例与代码片段 线程池的状态线程池的任务处理流程线程复用的实现四种常见的线程池newCa…

uniapp 自定义微信小程序 tabBar 导航栏

背景 做了一个校园招聘类小程序&#xff0c;使用 uniapp vue3 uview-plus pinia 构建&#xff0c;这个小程序要实现多角色登录&#xff0c;根据权限动态切换 tab 栏文字、图标。 使用pages.json中配置tabBar无法根据角色动态配置 tabBar&#xff0c;因此自定义tabBar&…

达梦数据库的系统视图v$ifun

达梦数据库的系统视图v$ifun 达梦数据库&#xff08;DM Database&#xff09;中V$IFUN 视图是用于检测函&#xff08;Function&#xff09;信息的。 在 Oracle 数据库中&#xff0c;类似的系统视图被称为动态性能视图&#xff0c;但在达梦数据库中并没有与 Oracle 一一对应的…

QT(1)-.pro 文件 转成.vcxproj 工程

1.qtcreator创建的文件转换成vs2019可以打开的。 1.QT webenginewidgets unknown modules webenginewidgets 要用 MSVC2017 &#xff0c;用minGW 32构建

使用Django身份验证系统

【图书介绍】《Django 5企业级Web应用开发实战&#xff08;视频教学版&#xff09;》_django 5企业级web应用开发实战(视频教学版)-CSDN博客 《Django 5企业级Web应用开发实战&#xff08;视频教学版&#xff09;》(王金柱)【摘要 书评 试读】- 京东图书 (jd.com) Django 5框…

windows中Selenium安装最新版Chrome WebDriver

windows中Selenium安装最新版Chrome WebDriver 需求&#xff1a;需要使用 selenium 对某个网页进行截图 文章目录 windows中Selenium安装最新版Chrome WebDriver一、查看Chrome版本二、找到对应的chromedriver版本三 安装3.1 确定google安装路径3.2 将下载的google driver 解压…

解决bug: RuntimeError: Address already in use,一个linux下pytorch多卡训练tcp端口占用的bug

时间&#xff1a;2024.9.3 1&#xff09;bug&#xff1a; self._store TCPStore( # type: ignore[call-arg] RuntimeError: Address already in use2&#xff09;原因分析 linux下pytorch多卡训练深度学习模型&#xff0c;训练中途暂停训练&#xff0c;但仍有进程占用某个端…

字典树Trie(专项复习)

一.P8306 【模板】字典树 题目思路:字典树的板子题,熟练写出insert函数(建树),以及query函数(查询)即可. 代码实现: #include<bits/stdc.h> using namespace std; typedef unsigned long long ull; typedef long long ll; #define N 3000005 #define P 131 ll f1[N]; s…

华为云征文|Flexus云服务X实例安装ODBC驱动,在ODBC中建立MySQL数据库连接,通过QT连接云数据库

引出 4核12G-100G-3M规格的Flexus X实例使用测评第2弹&#xff1a;Flexus云服务X实例安装ODBC驱动&#xff0c;在ODBC中建立MySQL数据库连接&#xff0c;通过QT连接云数据库 什么是Flexus云服务器X实例 官方解释&#xff1a; Flexus云服务器X实例是新一代面向中小企业和开发…

第140天:内网安全-横向移动局域网ARP欺骗DNS劫持钓鱼中间人单双向

目录 案例一&#xff1a;局域网&工作组-ARP原理-断网限制-单向 案例二&#xff1a;局域网&工作组-ARP欺骗-劫持数据-双向 案例三&#xff1a;局域网&工作组-DNS 劫持-钓鱼渗透-双向 案例一&#xff1a;局域网&工作组-ARP原理-断网限制-单向 原理&#xff1…

pytorch利用简单CNN实现葡萄病虫害图片识别

1 前言 之前我开发了一个葡萄病虫害的可视化系统&#xff0c;最近就想给这个系统增加2个功能&#xff0c;一个是对接一个AI助手&#xff0c;可以进行葡萄病虫害的咨询&#xff0c;直接对接千问大模型&#xff0c;这个在之前的博文里已经介绍过对接方法了&#xff0c;第二个是做…

ChatGPT与R语言融合技术在生态环境数据统计分析、绘图、模型中的实践与进阶应用

自2022年GPT&#xff08;Generative Pre-trained Transformer&#xff09;大语言模型的发布以来&#xff0c;它以其卓越的自然语言处理能力和广泛的应用潜力&#xff0c;在学术界和工业界掀起了一场革命。在短短一年多的时间里&#xff0c;GPT已经在多个领域展现出其独特的价值…