模型部署笔记

news2025/7/4 0:37:48

目录

模型部署工作
ONNX存在的意义
ONNX（Open Neural Network Exchange）
- ONNX示例
- 模型推理示例
- Batch调整
- 量化
- 量化方式
常见问题

模型部署工作

训练好的模型在特定软硬件平台下推理
针对硬件优化和加速的推理代码

训练设备平台：
CPU、GPU、DSP

ONNX存在的意义

模型与硬件之间的对应关系适配复杂度mxn的结果，导致开发复杂化、效率较低等问题

在这里插入图片描述
使用一种模型表达结构将训练框架的输出结构统一化，将模型部署复杂度从mxn转变为m+n

在这里插入图片描述
ONNX变身是一种模型格式，属于文本，不是程序，无法直接在设备上运行。因此，需要软件栈去加载ONNX模型，使其在硬件设备上高效推理。这个软件栈指的是模型的推理框架。推理框架分类硬件商自研和通用推理框架。自研推理框架底层优化较好，推理的计算效率较高，不具备普适性，无法应用到其他的芯片上。而通用推理框架是具备通用性，可应用在不同的软硬件平台下，降低开发难度，提升开发的效率，不需要用户关注底层框架，只需要将接口对应完成即可。
在这里插入图片描述整体推理过程：先使用模型框架训练完成模型后，转换为ONNX模型结构，在使用推理框架，将ONNX模型高效地运行在软硬件平台下。

ONNX（Open Neural Network Exchange）

一种针对机器学习所设计的开放式的文件格式，用于存储训练好的模型。不同的训练框架可采用相同格式存储模型并交互。由微软，亚马逊，Facebook和IBM等公司共同发起。
在这里插入图片描述

ONNX示例

使用torch.onnx.export进行onnx模型导出。
在这里插入图片描述
导出的onnx模型之后，进入netron.app进行模型结构可视化操作

在这里插入图片描述
ResNet的ONNX模型导出

参数讲解

模型推理示例

使用mmdeploy中示例，应用ONNX Runtime进行模型推理
在这里插入图片描述
使用TensorRT对ONNX模型进行推理

Batch调整

上述生成ONNX时，是使用（1, X,X,X）图像输入是1维度，导致模型推理时也为一张图一张图的推理，效率较慢，使用多张图进行模型推理，使用dynamic_axes参数即可实现。

在这里插入图片描述

在TensorRT模型数据格式转换中进行修改，minShapes和maxShapes参数设置

量化

除了使用Batch增加模型推理速度外，还可以使用量化进行加速。一般而言，使用float16不会影响模型的精度变化，而使用int8存储格式后模型精度会略有下降。
在这里插入图片描述

量化方式

训练后量化：Post-training quantization（PTQ）
训练时量化：Quantization-aware training（QAT）

如果使用的是QAT的话，是在模型训练过程中已经实现了模型精度的转换，使用onnx数据结构转换即可，而如果使用的是PTQ的话，需要在对应的计算平台上进行精度转换。

对称量化：取模型的数值对称区间，对应到INT8（-127，127）中，可以得到一个量化系数（简单理解为比例系数，127/6），从而将FP32中的数值与INT8进行对应。
在这里插入图片描述
在TensorRT中被称为calibration

常见问题

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/373513.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

2023.02.26 学习周报

2023.02.26 学习周报

文章目录摘要文献阅读1.题目2.摘要3.介绍4.模型4.1 SESSION-PARALLEL MINI-BATCHES4.2 SAMPLING ON THE OUTPUT4.3 RANKING LOSS5.实验5.1 数据集5.2 验证方式5.3 baselines5.4 实验结果6.结论深度学习元胞自动机1.定义2.构成3.特性4.思想5.统计特征流形学习1.降维2.空间3.距离…

阅读更多...

一些硬件学习的注意事项与快捷方法

一些硬件学习的注意事项与快捷方法

xilinx系列软件系统适用版本要安装在Ubuntu系统的话，要注意提前看好软件适用的版本，不要随便安好了Ubuntu系统又发现对应版本的xilinx软件不支持。如下图，发行说明中会说明这个版本的软件所适配的系统版本。下载 vivado vitis这些都可以…

阅读更多...

IT男的一次中年破局尝试--出书

IT男的一次中年破局尝试--出书

一、转战外企接上回《人到中年——IT男择业感悟》后，自己从大央企去了某知名外企。外企虽然最近几年的日子已经没有10年前的辉煌与滋润，但相对来说，还能勉强找到工作与生活的平衡点。划重点，35岁上下的人换工作理由&#xf…

阅读更多...

SpringBoot+React博客论坛系统附带详细运行指导视频

SpringBoot+React博客论坛系统附带详细运行指导视频

文章目录一、项目演示二、项目介绍三、项目运行截图四、主要代码一、项目演示项目演示地址： 视频地址二、项目介绍项目描述：这是一个基于SpringBootReact框架开发的博客论坛系统。首先，这是一个前后端分离的项目，文章编辑器…

阅读更多...

大学物理期末大题专题训练总结-磁学大题

大学物理期末大题专题训练总结-磁学大题

（事先声明指的是简单的那个磁学大题，另外一类涉及储存的磁能、磁感应强度分布下次说）求个磁通量，求个感应电动势，求个安培力大小......这个感觉是不是像你梦回高中？当然，这一块大题跟高中磁学部…

阅读更多...

hadoop-Combiner合并、OutputFormat

hadoop-Combiner合并、OutputFormat

一、Combiner合并 Combiner是MR程序中Mapper和Reducer之外的一种组件。 2）Combiner组件的父类就是Reducer 3）Combiner和Reducer的区别在与运行的位置；Combiner是在每一个MapTask所在的节点运行；Reducer是接收全局所有Mapper的输出…

阅读更多...

c++11 标准模板（STL）（std::unordered_set）（九）

c++11 标准模板（STL）（std::unordered_set）（九）

定义于头文件 <unordered_set>template< class Key, class Hash std::hash<Key>, class KeyEqual std::equal_to<Key>, class Allocator std::allocator<Key> > class unordered_set;(1)(C11 起)namespace pmr { templat…

阅读更多...

Linux学习（8.5）文件内容查阅

Linux学习（8.5）文件内容查阅

目录文件内容查阅： 直接检视文件内容 cat (concatenate) tac (反向列示) nl (添加行号列印) 可翻页检视 more (一页一页翻动) less (一页一页翻动) 数据撷取 tail (取出后面几行) 非纯文字档： od 修改文件时间或建置新档： touc…

阅读更多...

数据结构（六）二叉树

数据结构（六）二叉树

一、树形结构概念树是一种非线性的数据结构，它是由n（n>0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：1、有一个…

阅读更多...

昇腾AI新技能，还能预防猪生病？

昇腾AI新技能，还能预防猪生病？

国药集团动物保健股份有限公司（简称“国药动保”）是专业从事动物保健产品研发、生产和销售的国家高新技术企业，是国内少数几家具备新产品原创能力的动物保健企业。其中，猪圆环病毒灭活疫苗等市场份额位居行业前列。 “猪圆环病毒…

阅读更多...

【Linux学习笔记】8.Linux yum 命令和apt 命令

【Linux学习笔记】8.Linux yum 命令和apt 命令

前言本章介绍Linux的yum命令和apt命令。 Linux yum 命令 yum（ Yellow dog Updater, Modified）是一个在 Fedora 和 RedHat 以及 SUSE 中的 Shell 前端软件包管理器。基于 RPM 包管理，能够从指定的服务器自动下载 RPM 包并且安装&#xf…

阅读更多...

一种全新的图像滤波理论的实验（三）

一种全新的图像滤波理论的实验（三）

一、前言 2023年02月22日，我发布了滤波后，为针对异常的白色和黑色像素进行处理的实验，本次发布基于上下文处理的方案的实验，目的是通过基于加权概率模型滤波后，在逆滤波时直接修复大量的白色和黑色的异常像素&#xf…

阅读更多...

html css输入框获得焦点、失去焦点效果

html css输入框获得焦点、失去焦点效果

input输入框获得焦点、失去焦点效果废话shao shuo ! 直接看效果图，好吧！ 效果图： code: <!DOCTYPE html> <html> <head><title></title><meta charset"utf-8" /><style type"text…

阅读更多...

电子统计台账：海量数据中导入特定行，极力减少键盘编辑工作量

电子统计台账：海量数据中导入特定行，极力减少键盘编辑工作量

1 前言从事企业统计工作的小伙伴，本来已经够忙的了，现在又要加上什么电子台账这种鬼任务，而且居然还要每月来一次，简直不能忍。如果非要捏着鼻子忍了，那么有什么办法，减轻工作量？2 问题的提出有…

阅读更多...

应用场景五：西门子PLC通过Modbus协议连接DCS系统

应用场景五：西门子PLC通过Modbus协议连接DCS系统

应用描述： 西门子PLC（S7200/300/400/200SMART）通过桥接器可以支持ModbusRTU串口和ModbusTCP以太网（有线和无线WIFI同时支持）两种通讯方式连接DCS系统，不需要编程PLC通讯程序，直接在模块中进行地…

阅读更多...

【数据库】第九章关系查询处理与优化

【数据库】第九章关系查询处理与优化

第九章关系查询处理与优化索引索引文件是一种辅助存储结构，其存在与否不改变存储表的物理存储结构；然而其存在，可以明显提高存储表的访问速度。索引文件组织方式有两种：(相对照的，主文件组织有堆文件、排序文件、…

阅读更多...

Python3-字符串

Python3-字符串

Python3 字符串字符串是 Python 中最常用的数据类型。我们可以使用引号( ’ 或 " )来创建字符串。创建字符串很简单，只要为变量分配一个值即可。 Python 访问字符串中的值 Python 不支持单字符类型，单字符在 Python 中也是作为一个字符串使用…

阅读更多...

行测-判断推理-图形推理-位置规律-旋转、翻转

行测-判断推理-图形推理-位置规律-旋转、翻转

短指针每次逆时针旋转60（排除法选C走人）长指针每次顺时针旋转120选C左上菱形每次顺时针旋转90（排除C D）右上每次旋转180（选B走人）左下每次保持不变右下每次逆时针旋转90选B左上和右上为左右翻转&#xff0c…

阅读更多...

结合JasperReports输出报表

结合JasperReports输出报表

结合JasperReports输出报表前面我们已经使用Jaspersoft Studio设计了两个模板文件：demo1.jrxml和demo2.jrxml。其中demo1.jrxml的动态列表数据是基于JDBC数据源方式进行数据填充，demo2.jrxml的动态列表数据是基于JavaBean数据源方式进行数据填充。本小节…

阅读更多...

ATTCK实战系列-红队评估(一)

ATTCK实战系列-红队评估(一)

from ATT&CK实战系列-红队评估(一) 环境搭建下载地址:http://vulnstack.qiyuanxuetang.net/vuln/detail/2/ 将三个虚拟机启动起来除了windows 7那个主机，其他都只设置成仅主机模式 windows 7添加两个网卡，一个是仅主机，一个是NAT …

阅读更多...

推荐文章

最新文章