rk3568中带有0.8T算力的NPU,可以完成一些轻量级的图像识别任务。
本文向零基础人员介绍从windows中搭建训练环境,模型训练、模型转换到rknn模型部署到电路板上全部过程。
rk3568npu支持caffe、darknet、onnx、pytorch、tensorflow等多种框架。
本人使用的是pytorch框架的yolov5s算法训练的模型。yolov5在yolov3的基础上有很大提高,在保持准确率的情况下,模型更小,更适合轻量化的嵌入式产品部署。
1、下载和安装nvidia显卡驱动
下载对应你的英伟达显卡驱动。
NVIDIA 驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn
2、下载CUDA
cuda下载链接:https://developer.nvidia.com/cuda-downloads?
target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
3、下载cuDNN
cudnn下载地址:https://developer.nvidia.com/cudnn
这个需要有账号。
以上三个都是按照自己的电脑显卡配置、以及操作系统来下载的,不可以随意下载。
4、安装cuda
(1) 将cuda运行安装,建议默认路径
(2) 安装完成后设置环境变量
计算机上点右键,打开属性->高级系统设置->环境变量,可以看到系统中多了CUDA_PATH和
CUDA_PATH_V10_2两个环境变量。
接下来,还要在系统中添加以下几个环境变量:
这是默认安装位置的路径: C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64
在系统变量 Path 的末尾添加:
%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;
再添加如下5条(默认安装路径):
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\extras\CUPTI\lib64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2\bin\win64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2\common\lib\x64
注:与CUDA Samples相关的几个路径也可以不设置
5、安装cuDNN
复制cudnn文件
对于cudnn直接将其解开压缩包,然后需要将bin,include,lib中的文件复制粘贴到cuda的文件夹下
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2
注意:对整个文件夹bin,include,lib复制粘贴
7)CUDA安装测试
最后测试cuda是否配置成功:
打开CMD执行:nvcc -V
即可看到cuda的信息
说明配置成功