Triton部署之TensorRT-bugfix

Triton部署之TensorRT-bugfix

news2026/2/14 5:30:51

一、前言

Triton部署经常会有一些姨妈的错误，个人经验大都为版本不匹配导致；

二、本人环境

nvidia-smi:

使用的官方镜像为：nvcr.io/nvidia/tritonserver:21.09-py3
使用的onnx版本为：pip install onnx == 1.12.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
对应的版本链接可参考官网：
https://docs.nvidia.com/deeplearning/triton-inference-server/release-notes/rel_21-09.html#rel_21-09
除此之外，环境依赖安装了: pip install nvidia-pyindex nvidia-dali-cuda110

三、报错信息

报错信息如下：
E0719 02:45:05.225510 2971 logging.cc:43] 6: The engine plan file is not compatible with this version of TensorRT, expecting library version 8.0.3 got 8.0.1, please rebuild.
E0719 02:45:05.225711 2971 logging.cc:43] 4: [runtime.cpp::deserializeCudaEngine::75] Error Code 4: Internal Error (Engine deserialization failed.)

四、解决方案

1、原因很明显为8.0.1版本的TensorRT导致了不兼容问题，故重装了对应的tensorRT版本为：

pip install nvidia-tensorrt==8.0.3

2、重新模型转换：model.onnx --> model.plan

3、放到对应的Triton模型目录下：很奇怪的是为什么都要命名为model.onnx 或者 model.plan，可能内定写死了？反正我改名就可以检测到了；

五、参考链接

附上官网的用使用手册：Quickstart — NVIDIA Triton Inference Server

有问题随时联系，欢迎一键三连！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/774025.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Drools用户手册翻译——第四章 Drools规则引擎（一）核心概念介绍

Drools用户手册翻译——第四章 Drools规则引擎（一）核心概念介绍

之前翻译内容一下就是一大节，感觉有点多，我自己看这都费劲，这一章开始步入正题，我就一小节一小节翻译吧，比较容易阅读，修改错误也简单一些。甩锅声明：本人英语一般，翻译只是为了做…

阅读更多...

拼多多API接口，百亿补贴商品详情页面采集

拼多多API接口，百亿补贴商品详情页面采集

电商API的数据类型电商API提供的数据种类多样，一般可分为以下几类： 1.商品数据：商品ID、商品名称、商品价格、库存等。 2.交易数据：订单号、付款时间、收货人等。 3.店铺数据：店铺ID、店铺名称、开店时间、店铺评…

阅读更多...

SuperMap iServer新增支持FlatGeobuf数据格式，查询渲染性能提升2-3倍

SuperMap iServer新增支持FlatGeobuf数据格式，查询渲染性能提升2-3倍

导语 FlatGeobuf是一种地理数据存储格式，采用了二进制编码，相比其他文本或XML格式更高效，可以显著减小文件大小，这使得数据的传输和存储更加快速和高效。 SuperMap iServer 11i(2023) （以下简称SuperMap iServer11.1&a…

阅读更多...

【代码随想录 | Leetcode | 第三天】数组 | 长度最小的子数组

【代码随想录 | Leetcode | 第三天】数组 | 长度最小的子数组

前言欢迎来到小K的Leetcode|代码随想录|专题化专栏，今天将为大家带来滑动窗口的分享✨ 目录前言209. 长度最小的子数组总结 209. 长度最小的子数组 ✨题目链接点这里给定一个含有 n 个正整数的数组和一个正整数target。找出该数组中满足其和 ≥ target 的长度…

阅读更多...

ubantu下的前后端部署

ubantu下的前后端部署

ubantu 远程ssh连接通过ssh远程连接服务器，传输文件和执行命令首先更新软件包保证版本最新 sudo apt update安装ssh sudo apt install openssh-server安装完成后默认开启，也可输入命令查看ssh状态 sudo systemctl status ssh如果输入为下图&#…

阅读更多...

$warning: ignoring JAVA_HOME=D:\JDK； using bundled JDK报错解决$

warning: ignoring JAVA_HOME=D:\JDK； using bundled JDK报错解决

warning: ignoring JAVA_HOMED:\JDK; using bundled JDK报错原因是因为你JDK版本太低或者你的ElasticSearch版本太高降低版本即可、我的是JDK1.8我下载的是elasticsearch-8.7.0改成elasticsearch-7.6.1就可以了 elasticsearch-7.6.1地址：弹性搜索 7.6.1 |弹性的 …

阅读更多...

【动手学深度学习】--13.使用块的网络 VGG

【动手学深度学习】--13.使用块的网络 VGG

文章目录使用块的网络 VGG1.VGG块2.VGG网络3.训练模型使用块的网络 VGG 学习视频：使用块的网络 VGG【动手学深度学习v2】官方笔记：使用块的网络（VGG） 1.VGG块经典卷积神经网络的基本组成部分是下面的这个序列：…

阅读更多...

软件测试转车载测试应该怎么做？

软件测试转车载测试应该怎么做？

1、你要是零基础小白，做车载测试零基础没有经验，可以找到工作吗？没有汽车软件测试经验零基础小白能找到汽车测试的工作吗？对于企业而言，企业比较倾向于录用，就能给公司带来利益的员工来了就能直接上岗&…

阅读更多...

公开讲座笔记 | 雷达学报雷达系统微课 - 第一讲雷达系统与 “1+1=2“

公开讲座笔记 | 雷达学报雷达系统微课 - 第一讲雷达系统与 “1+1=2“

原笔记链接：https://mp.weixin.qq.com/s?__bizMzg4MjgxMjgyMg&mid2247486333&idx1&sn05397073a1e645d68e2611c9f9f3aeef&chksmcf51b984f8263092dd4ac6c6fd76817ae022ec8f0cda9a915245156cb4c3eb849091da06fdd1#rd 公开讲座笔记 | 雷达学报雷达系统…

阅读更多...

vue3 和vue2 的插槽写法区别

vue3 和vue2 的插槽写法区别

目录 1. vue2 2. vue3 注意的点： 1. vue2 2. vue3 注意的点： 在data里面定的初值，最好不要直接赋给表格数据。如下： data里面 editRow初始化给表格tableData 赋值

阅读更多...

Spring Boot学习

Spring Boot学习

Spring Boot 配置同一目录下配置文件优先级：.properties > .yml > .yaml 错误：org.yaml.snakeyaml.error.YAMLException: java.nio.charset.MalformedInputException: Input length 1 Caused by: java.nio.charset.MalformedInputException: Inp…

阅读更多...

将网页数据读入数据库+将数据库数据读出到网页——基于python flask实现网页与数据库的交互连接【全网最全】

将网页数据读入数据库+将数据库数据读出到网页——基于python flask实现网页与数据库的交互连接【全网最全】

本篇博客的目标是：在网页端输入数据，然后将数据存入数据库。但仅仅“存放”还不满能足需求，因此我们还需要能够取出数据，进行数据的比对分析。我们将任务分解为4步：第1步用python连接到数据库，第2步用pyt…

阅读更多...

ubuntu20.04部署Nessus_pro2023年6月30日版本

ubuntu20.04部署Nessus_pro2023年6月30日版本

这里写目录标题 1. 前期准备2. nessus前期安装2.1. 下载nessus2.2. 安装nessus2.3. 运行nessus 3. 设置nessus3.1. 初始化设置3.2. 无插件3.3. 获取更新插件3.4. 设置目录权限及插件信息3.4.1. 设置plugins目录权限3.4.2. 设置plugin_feed_info.inc权限3.4.3. 查看插件信息3.4.…

阅读更多...

如何成为网络安全大牛（黑客）？

如何成为网络安全大牛（黑客）？

网安专业从始至终都是需要学习的，大学是无法培养出合格的网安人才的。这就是为啥每年网安专业毕业生并不少，而真正从事网安岗位的人，寥寥无几的根本原因。如果将来打算从事网安岗位，那么不断学习是你唯一的途径。网络安全为什…

阅读更多...

C语言 register关键字与“傲娇的编译器”

C语言 register关键字与“傲娇的编译器”

1.作用： “建议”编译器把变量放到寄存器内，编译器不一定听你的（傲娇）！！ 2.速度：寄存器>高速缓存>内存，寄存器空间很宝贵（非常非常少） 3.寄存器不支持取…

阅读更多...

JavaScript基础篇(11-20题)

JavaScript基础篇(11-20题)

此文章，来源于印客学院的资料【第一部分：基础篇(105题)】，也有一些从网上查找的补充。这里只是分享，便于学习。诸君可以根据自己实际情况，自行衡量，看看哪里需要加强。概述如下： 模块化开…

阅读更多...

React和Vue生命周期、渲染顺序

React和Vue生命周期、渲染顺序

主要就是命名不同目录 React 组件挂载挂载前constructor() 挂载时render() 挂载后componentDidMount()：初始化节点更新更新时render()：prop/state改变更新后componentDidUpdate() 卸载卸载前componentWillUnmount()：清理 V…

阅读更多...

利用数据与分析，推动企业数字化发展的路线图

利用数据与分析，推动企业数字化发展的路线图

导读如今，保持数据与分析（D&A）战略与业务发展的统一同步，是助力企业机构成功和推进数字化项目的关键。敏捷的数据与分析能力对于培养感知-响应能力至关重要，可帮助企业机构满足全新的需求，进入前所未…

阅读更多...

git页面管理用户账号和密码（新建用户和初始化密码）

git页面管理用户账号和密码（新建用户和初始化密码）

本文章适用：没有固定的用户认证（AD域或者LDAP等），git私有仓库单独管理用户（新建用户和初始化密码）。 1.创建新用户以管理员的身份登录，进入git的管理模式，点击“New user”&…

阅读更多...

copilot使用初体验（一）

copilot使用初体验（一）

写函数 1、写一个注释，按下回车，会自动生成函数（函数名函数体），然后按下 tab，接受建议。 // 找出一个数组中houseId等于3的那项 findHouseIdIs3(arr) {return arr.find(item > item.houseId 3) },快捷…

阅读更多...

推荐文章

最新文章