tensorrt debug问题汇总

news2025/1/20 16:22:53

目录

1. Dynamic dimensions required for input: input, but no shapes were provided. Automatically overriding

2. sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaStreamCreate

3.  Assertion failed: (smVersion < SM_VERSION_A100) && “SM version not supported in this NVRTC version“


1. Dynamic dimensions required for input: input, but no shapes were provided. Automatically overriding

问题:pth转onnx时设置了动态维度Dynamic dimensions,如下所示

#
# SPDX-FileCopyrightText: Copyright (c) 1993-2022 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
# SPDX-License-Identifier: Apache-2.0
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#
 
from PIL import Image
from io import BytesIO
import requests
 
output_image="input.ppm"
 
# Read sample image input and save it in ppm format
print("Exporting ppm image {}".format(output_image))
response = requests.get("https://pytorch.org/assets/images/deeplab1.png")
with Image.open(BytesIO(response.content)) as img:
    ppm = Image.new("RGB", img.size, (255, 255, 255))
    ppm.paste(img, mask=img.split()[3])
    ppm.save(output_image)
 
 
import torch
import torch.nn as nn
 
output_onnx="fcn-resnet101.onnx"
 
# FC-ResNet101 pretrained model from torch-hub extended with argmax layer
class FCN_ResNet101(nn.Module):
    def __init__(self):
        super(FCN_ResNet101, self).__init__()
        self.model = torch.hub.load('pytorch/vision:v0.6.0', 'fcn_resnet101', pretrained=True)
 
    def forward(self, inputs):
        x = self.model(inputs)['out']
        x = x.argmax(1, keepdims=True)
        return x
 
model = FCN_ResNet101()
model.eval()
 
# Generate input tensor with random values
input_tensor = torch.rand(4, 3, 224, 224)
 
# Export torch model to ONNX
print("Exporting ONNX model {}".format(output_onnx))
torch.onnx.export(model, input_tensor, output_onnx,
    opset_version=12,
    do_constant_folding=True,
    input_names=["input"],
    output_names=["output"],
    dynamic_axes={"input": {0: "batch", 2: "height", 3: "width"},
                  "output": {0: "batch", 2: "height", 3: "width"}},
    verbose=False)
 

但是,onnx转trt时,必须指定推理维度,否则会报warning:

[W] Dynamic dimensions required for input: input, but no shapes were provided. Automatically overriding shape to: 1x3x1x1

输入维度变成了1x3x1x1,显然不对。

解决办法:

需指定维度:
 

trtexec.exe --onnx=E:\code\python\TensorRT-main\quickstart\SemanticSegmentation\fcn-resnet101.onnx --minShapes=input:1x3x1026x1282 --optShapes=input:1x3x1026x1282 --maxShapes=input:4x3x1026x1282 --workspace=4096 --saveEngine=E:\code\python\TensorRT-main\quickstart\SemanticSegmentation\fcn-resnet101.engine

2. sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaStreamCreate

 问题描述

已启动生成…
1>------ 已启动生成: 项目: tensorRTTest, 配置: Debug x64 ------
1>sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaStreamCreate,函数 "void __cdecl doInference(class nvinfer1::IExecutionContext &,float *,float *,int)" (?doInference@@YAXAEAVIExecutionContext@nvinfer1@@PEAM1H@Z) 中引用了该符号
1>sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaStreamDestroy,函数 "void __cdecl doInference(class nvinfer1::IExecutionContext &,float *,float *,int)" (?doInference@@YAXAEAVIExecutionContext@nvinfer1@@PEAM1H@Z) 中引用了该符号
1>sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaStreamSynchronize,函数 "void __cdecl doInference(class nvinfer1::IExecutionContext &,float *,float *,int)" (?doInference@@YAXAEAVIExecutionContext@nvinfer1@@PEAM1H@Z) 中引用了该符号
1>sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaMalloc,函数 "void __cdecl doInference(class nvinfer1::IExecutionContext &,float *,float *,int)" (?doInference@@YAXAEAVIExecutionContext@nvinfer1@@PEAM1H@Z) 中引用了该符号
1>sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaFree,函数 "void __cdecl doInference(class nvinfer1::IExecutionContext &,float *,float *,int)" (?doInference@@YAXAEAVIExecutionContext@nvinfer1@@PEAM1H@Z) 中引用了该符号
1>sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaMemcpyAsync,函数 "void __cdecl doInference(class nvinfer1::IExecutionContext &,float *,float *,int)" (?doInference@@YAXAEAVIExecutionContext@nvinfer1@@PEAM1H@Z) 中引用了该符号
1>D:\code\Cplusplus\tensorRTTest\x64\Debug\tensorRTTest.exe : fatal error LNK1120: 6 个无法解析的外部命令
1>已完成生成项目“tensorRTTest.vcxproj”的操作 - 失败。
========== 生成: 成功 0 个,失败 1 个,最新 0 个,跳过 0 个 ==========

一般这种“无法解析的外部符号”,多半是缺少lib库。这里是缺少cudart.lib和cuda.lib,在vs2019链接器上加上,问题解决。

myelin64_1.lib
nvinfer.lib
nvinfer_plugin.lib
nvonnxparser.lib
nvparsers.lib
cudart.lib
cuda.lib

3.  Assertion failed: (smVersion < SM_VERSION_A100) && “SM version not supported in this NVRTC version“

 问题描述:

以为是环境:

window10

TensorRT-7.0.0.11

cuda 10.2

cudnn 8.0.3

刚开始以为是TensorRT版本太低,7.0换成7.2.3,还是报一样的错误。

即环境

window10

TensorRT-7.2.3

cuda 10.2

cudnn 8.0.3

也不行。

升级cuda版本,由cuda10.2升级到11.0。报新的错误信息:

C:\source\rtSafe\cuda\cudaConvolutionRunner.cpp (483) - Cudnn Error in nvinfer1::rt::cuda::CudnnConvolutionRunner::executeConv

 从错误信息看是cudnn的问题。

解决办法:可能是显卡太高端了,全面升级

tensorRT 7.2.3  (TensorRT-7.2.3.4.Windows10.x86_64.cuda-11.1.cudnn8.1.zip)

cuda11.1  (cuda_11.1.0_456.43_win10.exe)

cudnn8.1  (cudnn-11.2-windows-x64-v8.1.0.77.zip)
问题解决

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/105955.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

条码管理系统,助力企业打造轻量级数字化车间

在原辅材料供应、生产管理、仓储物流、市场营销等相关业务环节中,采取适当的软硬件技术手段,实时记录产品信息。通过查询可以随时跟踪产品的生产状态、仓储状态和流向,达到可追溯管理的目的。随着制造企业对精细化管理要求的提高,…

【QT开发笔记-基础篇】| 第五章 绘图QPainter | 5.7 画笔设置

本节对应的视频讲解:B_站_视_频 https://www.bilibili.com/video/BV16W4y1g7dM 经过前面几节课的讲解,学会了绘制点、线、多段线、多边形、矩形、圆角矩形 到这里就可以学习画笔和画刷的设置了,本节先讲解画笔的设置 Qt 中画笔的类是 QPen…

正则表达式验证合集

1.定义封装的公共js 在src下定义一个util文件夹,并且定义个validate.js(当然你想取什么名字就什么名字哈哈哈哈) 2.上代码 //邮箱 /*** 邮箱* param {*} s*/ export function isEmail(s) {return /^([a-zA-Z0-9_-])([a-zA-Z0-9_-])((.[a-zA-Z0-9_-]{2,3}){1,2}…

基于FPGA的 矩阵键盘按键识别 【原理+源码】

目录 引言 原理阐述 实现方法 源码分享 板级调试演示 引言 最近了解了矩阵键盘扫描的原理,动手实现了一下,在这里做一个简单的总结。 原理阐述 矩阵键盘典型电路: FPGA的应用电路: 其中,行信号为FPGA输入信号&a…

企业从哪里开始构建弹性 IT 基础架构

混合工作模式扩大了工作范围,增加了 IT 团队的负担,因为他们需要在面对增加的攻击面时保持弹性。入侵企业的 IT 基础架构只需要一个受损的身份。 什么是企业标识? 这些是用户名、密码、网络、端点、应用程序等,充当业务敏感信息…

CheatEngine教程-官方9关

文章目录第一步:环境准备,下载并安装CE第二关:精确扫描数值第三关:未知数值扫描第四关:浮点数的扫描第五关:代码替换功能第六关:关于指针第七关:简单代码注入第八关:查找…

力扣(LeetCode)173. 二叉搜索树迭代器(C++)

设计 根据二叉树的中序遍历的迭代解法,稍改代码,就是本题的解法。 初始化 : 传入了根结点,根据迭代思路,将结点的左链依次入栈。 nextnextnext : 栈顶结点就是所求。根据迭代思路,当前结点要变成栈顶结点的右儿子。由…

Openlayers:自定义坐标系

Openlayers天然支持EPSG:4326(WGS1984地理坐标系)、EPSG:3857(Web墨卡托投影坐标系,即:将WGS84坐标系投影到正方形,南北投影范围为[-85.051129,+85.051129])。同时,Openlayers也支持开发者自定义坐标系。那么具体如何操作呢? 相关的API ol.proj.projection ol.proj.…

Android设计模式详解之工厂方法模式

前言 工厂方式模式是创建型设计模式; 定义:定义一个用于创建对象的接口,让子类决定实例化哪个类。 使用场景:在任何需要生成复杂对象的地方,都可以使用工厂方法模式。复杂对象适合使用工厂模式,用new就可…

【Java|golang】1753. 移除石子的最大得分

你正在玩一个单人游戏,面前放置着大小分别为 a​​​​​​、b 和 c​​​​​​ 的 三堆 石子。 每回合你都要从两个 不同的非空堆 中取出一颗石子,并在得分上加 1 分。当存在 两个或更多 的空堆时,游戏停止。 给你三个整数 a 、b 和 c &a…

攻防世界新手练习区——unseping

目录 知识点 解读题目源码: 命令绕过 知识点 PHP代码审计PHP序列化和反序列化PHP中魔术方法命令执行绕过方式 解读题目源码: 这道题首先一上来就是一段PHP代码,其中看到unserialize()就知道考的是反序列化,但是我们再往上看代码…

rust编程-struct结构体(chapter 5.1 结构体定义和实例化)

目录 1. 结构体定义和实例化 1.1 struct介绍 1.2 使用字段简写进行实例化 1.3 从其它对象实例化新结构体对象 1.4 使用无命名字段的struct类型 1.5 没有任何字段的structs结构体 1.6 结构体字段的值所有权 结构(struct)是一种自定义数据类型,可以将多个相关类…

存量时代下 用低代码开发平台提升你的CEM

随着人口及流量红利的逐步见顶,我国经济从增量市场迈入存量市场。在充分竞争的存量市场环境下,传统的初级竞争模式无法支撑产业的发展,相反还会让企业陷入持续烧钱的恶性循环中,获客难度的提升无疑加速了体验经济时代的到来&#…

modbus介绍、环境搭建测试与qt下串口/Tcp的demo工程测试

一、modbus的介绍 1.简介 Modbus是一种串行通信协议,于1979年为使用可编程逻辑控制器(PLC)通信而发表。Modbus已经成为工业领域通信协议的业界标准(De facto),并且现在是工业电子设备之间常用的连接方式&a…

SSM框架项目实战-CRM(客户关系管理1)

目录​​​​​​​ 1 项目介绍 1.1 crm简介 1.2 业务流程 1.3 crm的技术架构 2 物理模型设计 2.1 crm表的结构 2.2 主键字段 2.2 外键字段 2.3 关于日期和时间的字段 3 搭建项目环境 3.1 添加maven依赖 3.2 添加配置文件 3.3 添加页面和静态资源 ​编辑 4 首页…

超标量处理器设计——第九章_执行

参考《超标量处理器》姚永斌著 文章目录超标量处理器设计——第九章_执行9.1 概述9.2 FU类型9.2.1 ALU9.2.2 AGU9.2.3 BRU条件码分支正确性检查9.3 旁路网络9.3.1 简单设计的旁路网络9.3.2 复杂设计的旁路网络9.4 操作数的选择9.5 Cluster9.5.1 Cluster IQ9.5.2 Cluster Bypass…

Python 自动化测试(四):数据驱动

在实际的测试工作中,通常需要对多组不同的输入数据,进行同样的测试操作步骤,以验证我们的软件质量。这种测试,在功能测试中非常耗费人力物力,但是在自动化中,却比较好实现,只要实现了测试操作步…

前端基础_fillStyle和strokeStyle属性

fillStyle和strokeStyle属性 在前面的章节,在绘制图形时只用到默认的线条和填充样式。而在本节中将会探讨canvas全部的可选项,来绘制出更加吸引人的内容。如果想要给图形上色,有两个重要的属性可以做到:fillStyle和strokeStyle。…

社科院与杜兰大学金融管理硕士12门课程简介,其中有你心心念念的课程吗

当我们考量一个项目是否符合自身时,首先对课程设置是有要求的,课程设置是一个项目的灵魂所在,优质的课程与强大的师资更能体现项目的与众不同,下面一起去了解社科院与杜兰大学金融管理硕士项目12门必修课程概要,看看其…

【Java】java | maven | nexus私服 | maven私服 | docker安装nexus私服

一、说明 1、centos 7 2、docker 3、idea的maven项目 二、安装 1、拉取镜像 docker pull sonatype/nexus3:latest 2、创建映射目录并授权 mkdir /home/nexus/nexus-data && chown -R 200 /home/nexus/nexus-data 3、启动镜像 docker run -d -p 8081:8081 -p 8082:8082…