YOLO-V5 系列算法和代码解析（八）—

YOLO-V5 系列算法和代码解析（八）—— 模型移植

news2025/2/22 13:54:16

文章目录

- 工程目标
- 芯片参数
- 查阅官方文档
- 基本流程
- - Python 版工具链安装
  - RKNPU2的编译以及使用方法
- 移植自己训练的模型

工程目标

将自己训练的目标检测模型【YOLO-V5s】移植到瑞芯微【356X】芯片平台，使用C++推理，最终得到预期的结果。

芯片参数

芯片参数介绍：https://www.rock-chips.com/a/cn/product/RK35xilie/2021/0113/1273.html
CPU：四核，1.8GHZ.
NPU：1TOPs@Int8，每秒一万亿次运算。
在这里插入图片描述

查阅官方文档

通常每一款芯片都有其对应的使用文档和工具链，以此作为开发的参考。通过官方文档，可以确认开发环境（Ubuntu, python版本等），工具链版本，不同深度学习框架的Demo，以及一些特别的注意事项等。

python 版本工具链
rknn-toolkit2：https://github.com/rockchip-linux/rknn-toolkit2.

C 版本工具链
rknpu2：https://github.com/rockchip-linux/rknpu2，用于编译在RK板子上推理的工具链。

基本流程

大致流程：

安装Python版本的工具链（RKNN-ToolKit2），可以在PC端将（.onnx，.pt，.ckpt）导出为（.rknn）模型。可以验证自己训练的模型是否可以成功导出，卷积算子是否支持，预测效果是否可用，量化效果等。
PC端配置 C 版本工具链（RKNPU2），并且编译自己的C++ 推理工程，编译得到的可执行文件可以在RK芯片运行。
将得到RKNN模型和可执行文件，以及RK一些必要的依赖库(.so)放入芯片上，可以直接运行。

Python 版工具链安装

下图是Python版本工具链目录结构，在【DOC】目录中提供了英文版和中文版的使用文档。
在这里插入图片描述
初次使用该工具链的时候，仔细阅读如下文档：

“Rockchip_Quick_Start_RKNN_SDK_V1.4.0_CN.pdf”，该文档主要介绍了安装教程，运行demo以及一些基本的硬件参数，内容相对较少，（配置环境，运行demo建议阅读此文档）。
“Rockchip_User_Guide_RKNN_Toolkit2_CN-1.4.0.pdf”，详细介绍了API接口得使用规则，以及其它相关内容，（具体API的使用，可以参考此文档）。

本教程使用【pip】的方式安装，docker也是官方建议的安装方式，看自己对哪种方式更为熟悉。结合文档的流程，具体操作过程如下：

创建虚拟环境
conda create -n rknn2 python==3.6
conda activate rknn2
安装依赖库

进入工程的根目录

安装必要相应版本的依赖包
pip install -r doc/requirements_cp36-1.4.0.txt （下图是官方给的问题解决办法）

值得注意：在配置软件包的过程中，遇到“匹配不到XX版本”的问题，按照上述方式，并不能解决。
解决办法：首先安装Numpy（pip install numpy==1.19.5），然后执行上述命令，pip install -r doc/requirements_cp36-1.x.x.txt. 可能还有其它的错误，要根据错误提示，具体问题，具体分析。
安装RKNN软件包
python pip install packages/rknn_toolkit2-1.4.0_22dcfef4-cp36-cp36m-linux_x86_64.whl
检查RKNN-Toolkit2是否安装成功
如下图所示，没有出错，则表示安装成功

测试官方 YOLO-V5 Demo

运行目录下的【test.py】
python test.py
如下图所示，运行平台是PC(linux)模拟器，转换得到【yolov5s.rknn】模型。

RKNPU2的编译以及使用方法

主要介绍板子上为Linux系统64位的编译以及使用，具体流程如下：

下载编译工具
由于板子上是Linux系统，所以下载gcc编译器，下图是【官方推荐】的gcc版本以及下载链接，

遇到问题：上述GCC的下载链接不存在，也没有找到gcc-9.3版本的下载链接。后来又找到gcc-9.3（没有测试是否可用），https://gitlab.com/firefly-linux/prebuilts/gcc/linux-x86/aarch64/gcc-buildroot-9.3.0-2020.03-x86_64_aarch64-rockchip-linux-gnu.
解决办法：下载其它版本的交叉编译器，【gcc-6.3】，下载链接如下，
http://releases.linaro.org/components/toolchain/binaries/6.3-2017.05/aarch64-linux-gnu/（参考博客为：https://blog.csdn.net/song_lee/article/details/105487177）。
下载工具链
下载地址：https://github.com/rockchip-linux/rknpu2.
编译官方 YOLOV5 Demo
Git官方上的方法如下：https://github.com/rockchip-linux/rknpu2/tree/master/examples/rknn_yolov5_demo

仿照上述方式，针对自己下载的版本，终端命令如下：
export TOOL_CHAIN=/opt/gcc-linaro-6.3.1-2017.05-x86_64_aarch64-linux-gnu/
./build-linux_RK356X.sh
按照上述方法，仍并无法编译成功，报错如下：如图所示，找不到如下可执行文件 “aarch64-linux-gnu-gcc”

为此，修改【build-linux_RK356X.sh】脚本，将编译器所在目录写完整，具体修改如下图所示：

至此，可以成功编译YOLO-V5的例子，会在当前路径下生成【install】目录，目录中包含了扫地机上运行所需要的库，模型（可以通过rknn-toolkit2转换得到），测试图片，可执行程序，目录展开如下：

板子上运行（使用Adb）
下图是Git上给的方式，将adb线插到扫地机，进行扫地机和PC端进行数据传输

Xshell 连接板子，运行程序即可。

移植自己训练的模型

移植自己训练的YOLOV5s，由于应用任务场景的不同，输出与官方YOLOV5的输出略有差异。与官方的Demo相比，需要修改一些输出的尺寸。具体流程如下：

导出RKNN模型
注意修改网络的输出大小：官方的模型yolov5s 输出的形状如下
output[0].shape=(1, 255, 80, 80)，自训练的模型输出为(1, 3, 80, 80,21)
output[0].shape=(1, 255, 40, 40)，自训练的模型输出为(1, 3, 40, 40,21)
output[0].shape=(1, 255, 20, 20)，自训练的模型输出为(1, 3, 20, 20,21)
为了适配官方提供的后处理，可以导出中间层的模型。用软件【Netron】打开自训练的模型，获得指定输出层的编号，如下图所示，得到输出为 (1, 63, 40, 40)，

根据上述的网络节点的编号，代码需要修改的位置如下图所示，这样导出的模型可以完全与官方的后处理代码兼容。

编译RK板子的运行程序
参考上面的流程，修改相应的输出，直接编译即可。
板子上运行
参考上面的流程，运行即可。