【RK3588】YOLO V5在瑞芯微板子上部署问题记录汇总

news2025/1/17 18:03:15

YOLO V5训练模型部署到瑞芯微的板子上面,官方是有给出案例和转过详情的。并且也提供了Python版本的推理代码,以及C语言的代码。

但是,对于转换过程中的细节,哪些需要改?怎么改?如何改,和为什么这样改的问题,并没有给出详细的介绍。于是,本文就是对官方给出部分外的一个补充。这部分都是踩过坑的总结,相信会对你的操作会有较大帮助的。

一、从pytorchptrknn转换

  • 第一步: 使用yolov5提供的export.py函数导出yolov5.onnx模型
python3 export.py --weights yolov5s.pt --img-size 640 --include onnx
  • 第二步:使用onnxsim简化导出的yolov5.onnx模型

onnxsim是一个基于ONNX规范的工具,通过简化ONNX模型和优化ONNX模型,帮助用户减小模型大小、提高模型的推理速度和减少推理过程中的内存开销
onnxsim的工作原理是将一个ONNX模型简化成最少的节点,并优化这些节点,以最小化推理过程中的开销。
同时,onnxsim还可以处理支持的神经网络层类型,支持多个平台,例如:CPU,GPU, FPGA等。

onnxsim安装和使用:onnx-simplifier

pip3 install onnxsim

Then:

onnxsim input_onnx_model output_onnx_model
  • 第三步:要完全使用rknn提供的部署转换代码,需要根据简化后的onnx模型,选取合适层的输出,以替代以下代码中的‘378’,‘439’和‘500’,如下图onnx例子中的'onnx::Reshape_446',‘onnx::Reshape_484’,‘onnx::Reshape_522’。(这三个name,可能都是不一样的,是什么就填什么即可)
# Load ONNX model
print('--> Loading model')
ret = rknn.load_onnx(model=ONNX_MODEL, outputs=['onnx::Reshape_446', 'onnx::Reshape_484', 'onnx::Reshape_522'])
if ret != 0:
    print('Load yolov5 failed!')
    exit(ret)
print('done')

采用Netron打开的onnx文件,如下:

1疑问:为什么不用最后合并后的输出结果?

因为,最后的形状不固定导致的,有可能5个框,有可能10个框。输出模型到固定大小,后续操作放到后处理,目的是为了加快模型的npu上的推理速度(这里是我的理解,不一定正确,欢迎补充)

PyTorch中,神经网络的输出形状通常是根据输入形状来自动计算的,而在 ONNX 中,输出形状需要在转换时进行显式指定,这是由于 ONNX 的静态图执行模型与 PyTorch 的动态图执行模型不同所致。
当你将PyTorch模型转换为 ONNX 模型时,你需要为 ONNX 模型中的每个输出定义固定的形状,以便在模型执行时为其分配正确的内存空间。如果输出形状不固定,那么 ONNX 运行时就需要在运行时动态调整输出形状,这将使得模型在部署时的性能受到影响。
因此,在转换 PyTorch 模型为 ONNX 模型时,你需要手动指定每个输出的固定形状,以便在执行时能够顺利运行。

Yolo v5的输出格式一般为a × b × c × 85的形式,其中:

  1. a*b*c表示框的数目
  2. 85则涵盖框的位置信息(xc,yc,w,h)、前景的置信度Pc80个类别的预测条件概率c1,...,c80。(4+1+80,无背景类)

如果是你自己的模型,可能是只有3个目标类别,那么最后就是4+1+3=8,这个值记得在onnx模型中查看到。

二、需要注意事项

2.1、 设定anchor

anchor的设定,在训练yolo v5模型时候,是可以设定自动适应,采用聚类的方式,通过标注的目标框的大小,给出anchor的值。在train.py中,noaotoanchor的默认为False,如果设定为True,则会使用默认的anchor设定。

所以,如果经过autoanchor,给出了新的anchor设定,那么在推理和转完rknn后的设定,都需要与之相匹配的anchor,这个很重要。

为什么官方和很多博客,都没有注意到这个问题呢?因为大多数情况下,aotoanchor并没有发挥作用。都是使用了默认的,导致很多人即便没有注意到这个问题,最后的结果也不差。

但是,如果是不一样的,结果就会比较差,这个值就需要对应的做修改了。

2.1.1、训练阶段记录

如果在训练阶段,你已经关注到autoAnchor的输出结果,可以在这里直接进行记录,在terminal打印的内容,大致如下:

AutoAnchor: 3.60 anchors/target, 0.974 Best Possible Recall (BPR). Anchors are a poor fit to dataset ⚠, attempting to improve...
AutoAnchor: WARNING ⚠ Extremely small objects found: 764 of 27545 labels are <3 pixels in size
AutoAnchor: Running kmeans for 9 anchors on 27522 points...
AutoAnchor: Evolving anchors with Genetic Algorithm: fitness = 0.8052: 100%|██████████| 1000/1000 00:10
AutoAnchor: thr=0.25: 0.9996 best possible recall, 5.11 anchors past thr
AutoAnchor: n=9, img_size=640, metric_all=0.358/0.805-mean/best, past_thr=0.532-mean: 5,5, 7,8, 11,11, 17,17, 28,28, 41,37, 56,56, 79,82, 143,140

2.1.2、pt文件查询记录

查询autoAnchor记录到.pt文件内的anchor设定,如下:

import torch
import sys
sys.path.append("path/yolov5-master")
weights = 'best.pt'
model = torch.load(str(weights[0] if isinstance(weights, list) else weights), map_location='cpu')
model1 = model['ema' if model.get('ema') else 'model']
model2 = model1.float().fuse().model.state_dict()

for k,v in model2.items():
    if 'anchor' in k:
        # print(k)
        # print(v)
        print(v.numpy().flatten().tolist())

打印结果:

Fusing layers... 
[0.54345703125, 0.58251953125, 0.8525390625, 0.88818359375, 1.353515625, 1.318359375, 1.0859375, 1.0380859375, 1.75390625, 1.705078125, 2.38671875, 2.462890625, 1.7421875, 1.6787109375, 2.578125, 2.458984375, 3.904296875, 3.75]
[4.34765625, 4.66015625, 6.8203125, 7.10546875, 10.828125, 10.546875, 17.375, 16.609375, 28.0625, 27.28125, 38.1875, 39.40625, 55.75, 53.71875, 82.5, 78.6875, 124.9375, 120.0]
YOLOv5m summary: 308 layers, 21037791 parameters, 0 gradients

第二行是真的,需要取整。第一行…

经过我的发现,如果你打印的anchor就一行,那么可能是默认的anchor(默认使用COCO数据集的anchor),就是good fit to dataset,也就是默认的:

[[10, 13], [16, 30], [33, 23],
[30, 61], [62, 45],[59, 119],
[116, 90], [156, 198], [373, 326]]

2.2、rk3588推理性能

yolo v5m 量化前性能:

推理性能:
                               Performance                              
Total Time(us): 194162
FPS: 5.15

占用内存:
            Memory Profile Info Dump                  

NPU model memory detail(bytes):
    Total Weight Memory: 39.83 MiB
    Total Internal Tensor Memory: 19.50 MiB
    Total Memory: 59.33 MiB

量化后性能

推理性能:
                               Performance                              
Total Time(us): 137508
FPS: 7.27


占用内存:

            Memory Profile Info Dump                  
NPU model memory detail(bytes):
    Total Weight Memory: 20.03 MiB
    Total Internal Tensor Memory: 8.75 MiB
    Total Memory: 28.78 MiB

总的来说:

  • 模型时间效率上,量化后能降低30%194ms137ms
  • 占用内存上,量化后减少50%59Mib29Mib

三、C/C++ API部署

  • 目标检测 YOLOv5 - 基于 瑞芯微 Rockchip RKNN C API 实现 ----------- github代码

  • yolov8 瑞芯微 RKNN 的 C++部署------------- github代码

上述两个参考链接,基本囊括了一下几个部分:

  1. rknn模型转换
  2. Python rknn推理
  3. c/c++ rknn推理( YOLO v5部分是瑞芯微官方开放的代码)

如果你也是参考瑞芯微官方的C API代码,那么替换上你的模型后,有几个地方需要修改:

  1. 输入图像大小要改
  2. anchor尺寸要改
    const int anchor0[6] = {4, 5, 7, 7, 11, 11};
    const int anchor1[6] = {17, 17, 28, 27, 38, 39};
    const int anchor2[6] = {56, 54, 83, 79, 125, 120};
  3. 前景box阈值修改
    const float box_conf_threswin = 0.25;
  4. nms阈值修改
    const float nms_threswin = 0.1;
  5. 类别置信度重新调整
    objProbs.push_back(current_prob*box_confidence);
  6. 针对各个类,采用不同的阈值(待补充,这部分瑞芯微未采用这种二次过滤方式)

尤其是anchor这里,如果设定的不对,那么输出的结果就会非常的奇怪。如果是对的,那么差异性相对会小很多(和本地pt测试结果对比)。

四、总结

本文是对YOLO V5模型部署到瑞芯微板子上遇到的问题汇总。当然可能还会存在其他的更多问题,但是暂时还没有遇到,所以后面如果还会遇到什么问题,还会补充到这里。

如果你也正在做这块,并且遇到了问题,可以评论交流。目前还发现就是转模型后的评估问题,这个后面也会按照官方教程进行测试,这是下一篇的预告,期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1064766.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Altium Designer20.2.3安装详解

Altium Designer20.2.3是一个画PCB电路板的软件&#xff0c;今天有时间安装一下&#xff0c;接下来的一段时间就学习这个电路板的绘制了。特此记录下安装过程。 首先是下载软件&#xff0c;我直接放到我的网盘里面了。我把他分享出来吧&#xff01;希望能帮到更多的小伙伴&…

微信小程序开发缺少中间证书问题(腾讯云、阿里云等做服务器)

项目使用nginx做负载均衡后&#xff0c;不再采用原来直接用jar包的方式直接开启对应端口&#xff0c;所以需要重新从云服务器上下载证书&#xff0c;写入到Nginx读取的证书路径上即可。

SRTP协议与加密原理

1 SRTP简介 SRTP&#xff08;Secure Real-time Transport Protocol&#xff09;是一种用于保护实时通信数据的网络协议。它主要用于音频和视频通信&#xff0c;以确保数据的机密性和完整性。SRTP是在RTP&#xff08;Real-time Transport Protocol&#xff09;的基础上开发的&a…

基于安卓android微信小程序的旅游app系统

项目介绍 随着人民生活水平的提高,旅游业已经越来越大众化,而旅游业的核心是信息,不论是对旅游管理部门、对旅游企业,或是对旅游者而言,有效的获取旅游信息,都显得特别重要.自助定制游将使旅游相关信息管理工作规范化、信息化、程序化,提供旅游景点、旅游线路,旅游新闻等服务本…

【Verilog】采用采用模块结构建模,用1位全加器实现4位全加器详细步骤

题目要求&#xff1a; 采用模块结构建模&#xff0c;实例化四个1位全加器并连线&#xff0c;完成图示的四位全加器建模并编写四位全加器测试模块&#xff0c;在modelsim里执行&#xff0c;查看波形图。 首先&#xff0c;在工程区右键选择创建一个新文件去实现1位全加器的功能。…

图解AVL树的旋转操作

目录 AVL树的概念 AVL树结点的定义 AVL的插入 AVL树的旋转 左单旋 右单旋 左右双旋 右左双旋 AVL树的查找 AVL树的概念 二叉搜索树的缺点&#xff1a; 当构建二叉搜索树的数据有序或接近有序时二叉搜索树会退化为单链表。例如&#xff0c;当插入数据1&#xff0c;2&a…

Image resize, resample,rescale傻傻搞不懂看这里,大白话

Image resize, resample&#xff0c;rescale傻傻搞不懂 大白话 大家好&#xff0c;在学习图像处理的时候我们可能都对rescale&#xff0c;resize&#xff0c;resample感到困惑&#xff0c;在这里让我们进行学习一下。首先让我们现了解一下他们的大白话。resize就是改变大小&am…

项目部署之Jenkins

1. Jenkins介绍 Jenkins 是一款流行的开源持续集成&#xff08;Continuous Integration&#xff09;工具&#xff0c;广泛用于项目开发&#xff0c;具有自动化构建、测试和部署等功能。官网&#xff1a; http://jenkins-ci.org/。 Jenkins的特征&#xff1a; 开源的 Java语言…

ELF 文件介绍

前言 如果需要了解 动态加载,需要先了解需要动态加载的目标(对象):ELF 文件 ELF 文件用于 Linux、Unix等系统平台,与 Windows 上的 exe (PE)或者 DLL 文件格式不一样 ELF 简介 全称:Executable and Linking Format 中文:可执行和链接格式 ELF 文件格式是 Linux/Unix 通…

第一次微生物学实验

第一次微生物学实验 文章目录 前言一、显微镜油镜的使用以及细菌的简单染色法1.1. 实验目的1.2. 实验原理1.3. 实验材料1.4.实验步骤1.5. 实验结果及讨论1.5.1 实验结果1.5.2. 讨论 二、细菌的革兰氏染色以及芽孢染色法2.1. 实验目的2.2. 实验原理2.2.1. 革兰氏染色原理2.2.2. …

进程互斥的软件实现方法,硬件实现方法以及互斥锁

1.进程互斥的软件实现方法 1.单标志法 1.算法思想: 两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。 也就是说每个进程进入临界区的权限只能被另一个进程赋予。 2.例子 因此&#xff0c;该算法可以实现“同一时刻最多只允许一个进程访问临界区”。 3.主要…

网络初识必知会

局域网&#xff1a;把一些设备通过交换机/路由器连接起来 广域网&#xff1a;把更多的局域网也相互连接&#xff0c;当网络规模足够大的 交换机&#xff1a;组网过程中的重要设备&#xff01; 路由器&#xff1a;组网过程中的重要设备&#xff01; IP地址&#xff1a;描述一…

网络相关的基础知识整理

一、历史 1.1 早期阿帕网特点⭐⭐⭐ 没有纠错功能不能互联不同类型的计算机和不同类型的操作系统 1. 2 TCP/IP协议 点击【此处】跳转&#x1f517; TCP&#xff1a;用来检测网络传输中差错的传输控制协议IP&#xff1a;专门负责对不同网络进行互联的互联网协议&#xff08…

枚举,进制转换,char*,补码,算法,链表,位运算,NULL的含义

目录 什么是枚举 进制转换 字符指针 补码 算法 链表 算法 位运算符 ​编辑NULL的含义 什么是枚举 进制转换 4个二进制位组合才能有16个状态 字符指针 补码 编码就是解决这个东西到底用哪个二进制表示 不够位数指的是比如32位&#xff0c;前面都补1 #include <iostre…

Linux网络编程5-epoll模型

Linux网络编程5-epoll模型 1.epoll相关函数2.epoll服务器流程3.epoll服务器代码实现4.LT模式与ET模式5.ET模式一次性读完数据的实现6.epoll反应堆思想7.epoll反应堆代码实现8.epoll反应堆代码分析 1.epoll相关函数 #include <sys/epoll.h>int epoll_create(int size); /…

Bentley STAAD.Pro 2023 中文版 安装交流怎么安装?含解答

产品介绍 STAAD.Pro 是一个集结构建模、结构分析和结构设计于 一体的通用结构有限元程序。不仅具有常见的图形表格窗口 界面&#xff0c;而且有一个保存和修改建模分析设计命令的命令 编辑器。 另外&#xff0c;内置了几何建模向导和异形截面向导两个工具&#xff0c;为建模带来…

Gitlab+Jenkins自动化部署,解放双手

项目打包 ​ 在部署项目前需要对源码进行打包&#xff0c;一个简单的SpringBoot项目默认是打包为jar包&#xff0c;也就是在pom.xml中的<packaging>jar</packaging>方式&#xff0c;当然也会有一些打包成war包方式&#xff0c;使用外置的Tomcat应用服务器部署war包…

凉鞋的 Godot 笔记 106. 第二轮循环2D 场景视图Label

从这一篇开始&#xff0c;我们开始进行第二轮循环。 这次我们至少能够在游戏运行窗口能看到一些东西。 首先还是在场景窗口进行编辑&#xff0c;先创建一个节点: 在弹出的窗口&#xff0c;我们找到 Control/Label &#xff0c;如下所示: 点击创建&#xff0c;然后我们在 2D 的…

【dp】背包问题

背包问题 一、背包问题概述二、01背包问题&#xff08;1&#xff09;求这个背包至多能装多大价值的物品&#xff1f;&#xff08;2&#xff09;若背包恰好装满&#xff0c;求至多能装多大价值的物品&#xff1f; 三、完全背包问题&#xff08;1&#xff09;求这个背包至多能装多…

有点奇葩的消息——CEO 2 个月之前也离职了

这个消息还是有点奇葩的。 在找工作一段时间后&#xff0c;有原公司的同事联系了下互相通报了下各自的情况。 如有看过&#xff1a;北美 2023 被裁员的感悟 这篇文章的大致都知道公司在4个月前&#xff0c;也就是2023年6月份的时候进行了大规模的裁员&#xff0c;公司也只保留…