TensorRT加速的原因：量化+网络结构优化

TensorRT加速的原因：量化+网络结构优化

news2025/4/17 9:54:23

文章目录

1. TensorRT 简介
2. TensorRT 加速的原理
- 量化
- 网络结构优化
3. TensorRT 的工作流程
- TensorRT引擎的构建：Build
- TensorRT引擎的推理：Infer

1. TensorRT 简介

TensorRT可以帮助你把训练好的AI模型，部署到边端Nvidia的设备，并实现对模型的量化与加速。
TensorRT基于CUDA和cudnn

CUDA看作是一个工作台，上面配有很多工具，如锤子、螺丝刀等。

cuDNN是基于CUDA的深度学习GPU加速库，它就是个锤子。

CUDA这个工作台买来的时候，并没有送锤子。
想要在CUDA上运行深度神经网络，就要安装cuDNN，这样才能使GPU进行深度神经网络的工作，工作速度相较CPU快很多。
请添加图片描述

2. TensorRT 加速的原理

量化

TensorRT可以对模型进行int8，float16的量化，通过在**减少计算量和保持精度 **之间达到一个理想的平衡点。

网络结构优化

TensorRT同时对网络结构进行了重构和优化

通过解析模型，将网络中无用的输出层消除以减小计算。
对网络结构的垂直整合，举个例子，将CONV, BN, RELU 三个层融合在了一起。
对网络结构的水平整合。将输入为相同的张量 和执行 相同操作 的层融合在一起。
对 CONCAT 层的输出直接送入下面的操作，不单独进行concat后再进行计算，减少了一次传输吞吐

3. TensorRT 的工作流程

分为两个流程：构建期，推理运行期

TensorRT引擎的构建：Build

前期准备Logger, builder, config
创建Network（计算图）
生成序列化网络引擎

TensorRT引擎的推理：Infer

反序列化引擎
Buffer的相关准备
执行推理

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1165854.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

结合组件库实现table组件树状数据的增删改

结合组件库实现table组件树状数据的增删改

如图所示，可以实现树状数据的新增子项，新增平级，删除。主要用到了递归代码： <template><el-table :data"tableData" style"width: 100%; margin-bottom: 20px" row-key"id" border def…

阅读更多...

大促期间如何监测竞品数据

大促期间如何监测竞品数据

无论在什么时候，竞品的数据都是品牌非常关注的，大促当然也不例外，所以准确监测到竞品数据应该如何分析也很关键，通过分析竞品，品牌可以获取非常多有价值的内容，如竞品王牌产品的分析、行业分析报告等。力维…

阅读更多...

JAVA毕业设计108—基于Java+Springboot的OA办公自动化人事管理系统(源码+数据库)

JAVA毕业设计108—基于Java+Springboot的OA办公自动化人事管理系统(源码+数据库)

基于JavaSpringboot的OA办公自动化人事管理系统(源码数据库)108 一、系统介绍本系统分为员工、部门经理、人事、管理员四种角色(角色菜单可以自行分配) 用户： 登录、考勤管理、申请管理、任务管理、日程管理、工作计划管理、文件管理、笔记管理、邮件管理、通讯…

阅读更多...

如何在 Photoshop 中制作水晶效果

如何在 Photoshop 中制作水晶效果

如何在 Photoshop 中仅使用一些智能滤镜快速轻松地制作水晶效果 1.如何在 Photoshop 中创建快速背景步骤1 首先，让我们从一个新的画布开始，使用颜色填充图层填充柔和的紫罗兰色。通过选择图层并右键单击 > 转换为智能对象，将该颜色填充…

阅读更多...

什么是Node.js的流（stream）？它们有什么作用？

什么是Node.js的流（stream）？它们有什么作用？

聚沙成塔每天进步一点点 ⭐ 专栏简介前端入门之旅：探索Web开发的奇妙世界欢迎来到前端入门之旅！感兴趣的可以订阅本专栏哦！这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

阅读更多...

设计模式第一课-单例模式(懒汉模式和饿汉模式)

设计模式第一课-单例模式(懒汉模式和饿汉模式)

单例模式个人理解：单例模式实际就是通过类加载的方式获取到一个对象，并且保证这个对象在使用中只有一个，不允许再次被创建一、懒汉模式 1、懒汉模式的基础写法代码解释： （1）、编写LazySingleton类的…

阅读更多...

图解系列--路由器和它庞大的功能

图解系列--路由器和它庞大的功能

03.01 何为路由器路由器是指主要负责 OSI参考模型中网络层的处理工作，并根据路由表信息在不同的网络之间转发IP 分组的网络硬件(图3-1)。这里的网络一般是指IP 子网，也可以称为广播域。此外，现在的路由器还会搭载其他各种各样的功能。 0…

阅读更多...

3D人像手办定制业务再掀热潮，这一次有怎样的革新？（方法篇）

3D人像手办定制业务再掀热潮，这一次有怎样的革新？（方法篇）

最近，3D真人手办热潮再起，最出圈的一次当属亚运会的3D打印元宇宙体验舱里面各国运动员带火的真人手办定制项目。作为3D技术推广者，博雅仔也在后台接受了很多朋友的询问—— ◆ 技术已经成熟了吗？ ◆ 个人定做3D真人手办市场价格…

阅读更多...

[机缘参悟-116] ：世间的四张大网以及新型的第五张网，以及在网中流动的内容

[机缘参悟-116] ：世间的四张大网以及新型的第五张网，以及在网中流动的内容

目录一、第一张网：人际网（人）》流动是人的知情意行 1.1 什么是人际网 1.2 人际网中流动是人的知情意行 1.2.1 在人际网中，流动的是人与人之间的各种信息、情感和资源。 1.2.2 在人际网中流动的是人的知情意行 1.2.3 在人际…

阅读更多...

基于JAVA+SpringBoot+Vue的前后端分离的大学生创新作品审核平台

基于JAVA+SpringBoot+Vue的前后端分离的大学生创新作品审核平台

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍： 随着大学教育的发展&a…

阅读更多...

实战演练——拦截史迪仔广播

实战演练——拦截史迪仔广播

目录目录 1.MainActivity 2.MainActivity2 3.MyHelper 4.OutCallReceiver 5.activity_main.xml 6.activity_main2.xml 7.item.xml 8.themes.xml 9.项目代码布局情况 10.运行情况展示 11.该项目常见报错以及解决方法完成一个拦截拨号的app，包含以下功…

阅读更多...

Rust 语言和 select 库的编写程序

Rust 语言和 select 库的编写程序

使用 Rust 语言和 select 库的下载器程序，用于下载视频。首先，我们需要导入 select 库。select 库是一个用于处理多个输入/输出流的 Rust 库。它提供了一个函数，可以让我们等待多个文件描述符（如网络套接字）可读或可…

阅读更多...

【Python 零基础入门】Numpy 常用函数通用函数保存加载

【Python 零基础入门】Numpy 常用函数通用函数保存加载

【Python 零基础入门】内容补充 4 Numpy 常用函数通用函数 & 保存加载概述通用函数np.sqrt 平方根np.log 对数np.exp 指数np.sin 正弦点积和叉积np.dot 点积叉积矩阵乘法np.matmul 保存 & 加载np.save 保存单个数组np.savez 保存多个数组np.savez_compressed 保存n…

阅读更多...

Halcon计算点到直线的垂线方程

Halcon计算点到直线的垂线方程

一、我们都知道，点到直线最短距离就是垂线。Halcon也有现成的算子可以计算点到直线的距离 distance_pl( : : Row, Column, Row1, Column1, Row2, Column2 : Distance)。但是此算子不会返回具体的垂点坐标。当我们希望显示垂线的时候是需要知道垂点坐标，才…

阅读更多...

目前比较好用的护眼台灯?最好用的五款护眼台灯推荐

目前比较好用的护眼台灯?最好用的五款护眼台灯推荐

灯具可以说是我们日常生活中使用很频繁的工具了，我们每天都离不开它给我们带来的光亮。当然，现在灯具也有很多种类可以挑选，今天主要带来五款非常好用的护眼台灯指南。 1.书客护眼台灯Pro 使用体验分数：10分亮点：具…

阅读更多...

我的1024创作纪念日

我的1024创作纪念日

文章底部有个人公众号：热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享？ 踩过的坑没必要让别人在再踩，自己复盘也能加深记忆。利己利人、所谓双赢。机缘起初我并没有写博客这个习惯&#xff…

阅读更多...

酷开会员丨相约酷开系统追剧，看漫画IP《一人之下》究竟有何魅力？

酷开会员丨相约酷开系统追剧，看漫画IP《一人之下》究竟有何魅力？

8月份，由国产动漫《一人之下》改编的电视剧《异人之下》空降播出的第二天，突然宣布由于“介质原因”本片将延期播出。官宣当日即开播、开播次日即停播，《异人之下》的初登场看上去就像一则极具国产特色的超短篇笑话。之后，当我们几…

阅读更多...

numpy中的log和ln函数介绍

numpy中的log和ln函数介绍

np.log()指代的便是数学中使用的ln函数。 np.log10()指代的便是数学中使用的lg函数。 import numpy as npprint(np.log(np.e))print(np.log10(100))

阅读更多...

python脚本，实现监控系统的各项资源

python脚本，实现监控系统的各项资源

shigen坚持日更的博客写手，擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。坚持记录和分享从业两年以来的技术积累和思考，不断沉淀和成长。今天的文章涉及到docker的操作和一个python脚本，实现监控网络的流量、CPU使用…

阅读更多...

SSL证书在网购中的重要性

SSL证书在网购中的重要性

近年来，互联网的快速发展使得线上服务范围不断延伸，这其中网络购物更是在全球范围内都呈现上升趋势。然而病毒攻击，网络钓鱼攻击和恶意软件攻击无处不在，网上购物的安全性受到极大威胁。为了保护网络购物的安全，构建可…

阅读更多...

推荐文章

最新文章