Ubuntu20.04配置深度学习环境
对于一台新Ubuntu20.04主机,想要直接进行深度学习模型的训练,需要进行一些常规配置。本文针对的情况包括物理机和虚拟机。安装部分本文不介绍,只介绍配置环境部分。
1. 安装中文输入法
参考如下博客:Ubuntu中文输入法
2. 更换apt源
参考这篇文章:更换apt源
3. 安装zerotier 【可选】
zerotier是用来进行内网穿透的,如果有这方面需求的朋友可以安装。官网链接
在终端中输入curl -s https://install.zerotier.com | sudo bash
安装zerotier
安装完成后,输入sudo zerotier-cli info
,显示结果如下,则表明安装成功了,如果失败了,可以尝试卸载重装。
200 info c7cb5c3623 1.10.3 ONLINE
通过在官网注册账号,创建一个网络,并让ubuntu主机加入创建好的新网络。假设新创建的网络号是net_number
,则通过如下命令加入(将net_number
修改成你自己创建的网络号)
sudo zerotier-cli join net_number
显示200 join OK
表明成功加入网络。
接下来,开启防火墙,sudo ufw enable
4. 配置SSH
安装openssh:sudo apt install openssh-server
安装后,查看SSH运行状态:sudo systemctl status ssh
设置防火墙允许22端口出入:sudo ufw allow 22/tcp
5. 安装vscode 【可选】
可以直接通过Ubuntu software安装
6. 安装miniconda
教程参考这篇博客:安装Miniconda
7. 安装CUDA
截至目前(2023/2/24)最新版是cuda12.0,故本教程安装cuda12.0.
在安装cuda12.0之前,先根据官网对照表查看下cuda版本对应显卡驱动版本最低要求(如果驱动版本和cuda不对应会有电脑无法正常启动的风险,谨慎操作):Cuda和驱动版本对应
由上表可以看出,想安装cuda12.0需要至少525.60.13的驱动版本。安装如下步骤进行驱动安装更新:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00002204sv00001462sd00003882bc03sc00i00
vendor : NVIDIA Corporation
driver : nvidia-driver-525 - third-party non-free
driver : nvidia-driver-470 - distro non-free
driver : nvidia-driver-470-server - distro non-free
driver : nvidia-driver-515-open - distro non-free
driver : nvidia-driver-515-server - distro non-free
driver : nvidia-driver-525-server - distro non-free
driver : nvidia-driver-515 - distro non-free recommended
driver : nvidia-driver-510 - distro non-free
driver : nvidia-driver-525-open - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
# 或者安装指定驱动(这里挑选自己需要的驱动,然后安装即可,不必卸载之前装过的驱动)
$ sudo apt install nvidia-driver-525
接下来开始安装cuda12.0。
首先从官网下载最新版的安装包,Cuda12.0
根据官方提示,在终端中输入如下指令进行下载和安装
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.0.1/local_installers/cuda-repo-ubuntu2004-12-0-local_12.0.1-525.85.12-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-0-local_12.0.1-525.85.12-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-0-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
安装完成后,需要将CUDA的路径添加到系统环境变量中。打开终端,执行以下命令:
echo 'export PATH=/usr/local/cuda-12.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
测试CUDA是否安装成功。可以使用以下命令查看CUDA版本信息:
nvcc --version
如果输出类似于以下内容,则表示CUDA安装成功:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Fri_Jan__6_16:45:21_PST_2023
Cuda compilation tools, release 12.0, V12.0.140
Build cuda_12.0.r12.0/compiler.32267302_0
接下来测试下nvidia-smi
命令:
如果输出类似于以下内容,则表示一切顺利:
Fri Feb 24 14:38:04 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.85.12 Driver Version: 525.85.12 CUDA Version: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... On | 00000000:01:00.0 On | N/A |
| 0% 34C P8 16W / 420W | 168MiB / 24576MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1343 G /usr/lib/xorg/Xorg 44MiB |
| 0 N/A N/A 1664 G /usr/bin/gnome-shell 121MiB |
+-----------------------------------------------------------------------------+
8. Pytorch-GPU安装 【可选】
安装完成CUDA后,进行pytorch-GPU安装,参考官方安装教程:Pytorch安装
在终端输入如下命令安装:
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia
安装完成后,在终端中打开python交互界面(在终端中输入python,然后回车进入),输入如下命令:
import torch
print(torch.cuda.is_available())
如果输出结果是True
,则表明Pytorch-GPU安装成功。