【TensorRT】基本介绍

news2025/4/28 1:00:11

TensorRT用于高效实现已经训练好的深度学习的模型的推理过程的SDK，能使DL模型有更快的推理速度和更高的吞吐量。官方提供Python和C++两种接口，形式基本一致且相互对应。

1 ✨ TensorRT介绍

🍟1.1 TensorRT的工作

分为两个时期（构建期和运行期）：

1-1 构建期工作

name	description
模型解析/建立	加载 Onnx等其他格式的模型/使用原生API搭建模型
计算图优化	横向层融合(Conv)，纵向层融合(Conv+add +ReLU)
节点消除	去除无用层，节点变换(Pad,Slice，Concat，Shuffle)
多精度支持	FP32/ FP16 / INT8 / TF32(可能插入reformat节点)
优选kernel/format	硬件有关优化
导入plugin	实现自定义操作
现存优化	显存池复用

1-2 运行期工作

name	description
运行时环境	对象生命期管理，内存显存管理，异常处理
序列化/反序列化	推理引擎保存为文件或从文件中加载

🌭1.2 TensorRT流程

在这里插入图片描述
构建期：

创建logger（日志记录器）
建立Builder（引擎构建器，包含计算图属性信息）和BuilderConfig（Builder相关选项）
创建Network（计算图具体内容），网络主体。
生成SerializedNetwork（网络的TRT内部表示）

运行期：
5. 建立Engine（模型计算核心）和Context（类比进行）
6. Buffer（数据内存、显存）相关准备（Host端+device端）
7. Buffer拷贝 Host to Device
8. 执行推理（Execute）
9. Buffer拷贝 Device to Host
10.善后工作
在这里插入图片描述

🍿1.3 模型转化（DL Network=>TRT Network）

在这里插入图片描述
三种方案：

使用框架自带的TRT接口。简单灵活，部署仍在原框架中，无需书写Plugin，但是牺牲了一定的性能。
使用Paser（推荐）。流程成熟，ONNX通用性好，方便网络调整，兼顾效率性能。
使用TensorRT原生API搭建网络。性能最优，精细网络控制，兼容性最好，但是应用性和开发效率较低。

✨ 2 API介绍

在这里插入图片描述

🧂2.1 logger（日志记录器）

"""
trt.Logger.VERBOSE：可选参数，产生不同等级的日志，由详细到简略分别为VERBOSE，INFO，WARNING，ERROR，INTERNAL_ERROR
"""
logger = trt.Logger(trt.Logger.VERBOSE)

通常使用VERBOSE和INFO两个，可获得网络优化过程和接口信息。

🥓 2.2 Builder（引擎构建器）以及BuilderConfig

Builder：

builder = trt.Builder(logger)

builder.max_batch_ size = 256，指定最大Batch Size（Static Shape模式下使用）

BuilderConfig：

config = builder.create_builder_config()

常用属性有：

name	description

🥚2.3 Network（网络具体构造）

"""
param：`1 <<int(tensorrt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH)`，使用Explicit Batch模式。
"""
network = builder.create_network()

常用方法：

name	description
network.add_input( ‘oneTensor’ ,trt.float32,(3,4,5))	标记网络输入张量
network.add_input( ‘oneTensor’ ,trt.float32,(3,4,5))	添加layer
network.mark_output(convLayer.get_output(O))	标记网络输出张量

🍿2.4 生成Engine

serializedNetwork = builder. build_serialized_network(network, config)  # SerializedNetwork（TRT内部表示）
engine = trt.Runtime(logger).deserialize_cuda_engine(serializedNetwork)

在这里插入图片描述

什么是binding：
在这里插入图片描述
可以用context.get_binding_shape(2)或context.get_binding_shape(3)获取网络信息

🤣2.5 生成Context

context = engine.create_execution_context()

在这里插入图片描述

cuda异构计算：
在这里插入图片描述

🥓2.6 Buffer

在这里插入图片描述

2.7 🎃 TRT文件保存

在这里插入图片描述

✨3 模式选择

为什么选择Explicit Batch模式，而不选择Implicit Batch模式：
在这里插入图片描述

✨ 4 精度

4.1 🍟 FP16

在这里插入图片描述

✨5 Parser

在这里插入图片描述

✨ 6 使用框架内的接口

在这里插入图片描述

1

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/712098.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【TensorRT】基本介绍

1 ✨ TensorRT介绍

🍟1.1 TensorRT的工作

🌭1.2 TensorRT流程

🍿1.3 模型转化（DL Network=>TRT Network）

✨ 2 API介绍

🧂2.1 logger（日志记录器）

🥓 2.2 Builder（引擎构建器）以及BuilderConfig

🥚2.3 Network（网络具体构造）

🍿2.4 生成Engine

🤣2.5 生成Context

🥓2.6 Buffer

2.7 🎃 TRT文件保存

✨3 模式选择

✨ 4 精度

4.1 🍟 FP16

✨5 Parser

✨ 6 使用框架内的接口

1

相关文章

flask socket版本问题

红帽宣布为RHEL 7延长4年生命周期

uniapp解决跨域问题

7.1.4 【Linux】与目录树的关系

STM32 创建工程（库函数）

爱玩粥的有福了，带图形界面的明日方舟皮肤的员工管理系统，数据结构期末实训满分。

JavaEE学习的第三部分（重点在第四个知识点，SSM框架整合）

计算机毕业论文内容参考|基于Python的高校二手网络交易平台的设计与实现

3、boostrap图片视频上传展示

免费使用！国产品牌JoySSL为中国高校网站（edu.cn）提供专属SSL证书

Python Dataframe-B更新Dataframe-A

【Nacos 学习记录】

【C语言】杨辉三角和练习

Echarts区域面积areaStyle用图片进行纹理填充

2023年5月少儿编程中国电子学会图形化编程等级考试Scratch编程一级真题解析（判断题）

Linux--设置目录或文件的默认权限：umask权限掩码

中间件——统一白名单配置

linux docker安装及报错处理

基于Python所写的火车票分析助手设计

什么是KubeEdge？