Triton Inference Server 环境配置

news2025/12/20 21:58:31

本人环境

Ubuntu18.04，3090显卡，显卡驱动版本510.85.02，cuda版本11.6，docker版本20.10.12(注意：docker一定要通过apt安装，用snap安装会报错)

安装步骤

1. 根据驱动版本和cuda版本下载对应版本的Triton Docker 镜像，版本对应关系参照：Release Notes :: NVIDIA Deep Learning Triton Inference Server Documentation

执行以下命令，注意将“22.01”换成你自己对应的版本。

$ docker pull nvcr.io/nvidia/tritonserver:22.01-py3

2. 下载模型库例程，注意将“22.01”换成你自己对应的版本。

$ git clone -b r22.01 https://github.com/triton-inference-server/server.git
$ cd server/docs/examples
$ ./fetch_models.sh

3. 从 NGC Triton 容器中启动 triton

注意${PWD}/model_repository:/models是将当前路径下的model_repository文件夹挂载到容器的/model路径下，所以该命令要在路径 server/docs/examples下执行。注意将“22.01”换成你自己对应的版本。

$ cd server/docs/examples
$ sudo docker run --gpus=0 --rm --net=host -v ${PWD}/model_repository:/models nvcr.io/nvidia/tritonserver:22.01-py3 tritonserver --model-repository=/models

执行成功出现如下图所示结果：

4. 新建一个命令控制台，从 NGC Triton SDK 容器启动 image_client 示例

注意将“22.01”换成你自己对应的版本。

$ sudo docker run -it --rm --net=host nvcr.io/nvidia/tritonserver:22.01-py3-sdk

执行成功后进入容器，然后再运行以下命令：

$ /workspace/install/bin/image_client -m densenet_onnx -c 3 -s INCEPTION /workspace/images/mug.jpg

执行成功后结果如下图所示：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/43184.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Triton Inference Server 环境配置

本人环境

安装步骤

相关文章

java计算机毕业设计ssm驾校预约考试管理系统a3cf7（附源码、数据库）

第四章. Pandas进阶—日期数据处理

Deepwalk详解

关于MuLoginWebGL介绍说明：

2023年湖北监理工程师考试科目有哪些？考试题型什么样子的？

社交电商时代，切勿剑走偏锋，始终以产品为中心，模式为辅助

必须了解的海外新闻稿写作要点 ️

Python学习基础笔记十四——函数参数

学习python中的数据结构

[附源码]SSM计算机毕业设计网上鞋店管理系统JAVA

Pan-cancer image-based detection of clinically actionable genetic alternations

中纺集团×StarRocks：构建企业级数据资产管理的实践

使用扩展有效对齐 SwiftUI 内容，创建自定义 SwiftUI 方法以快速对齐项目并使您的代码看起来简洁明了（教程含源码）

配置Nginx和其他应用的HTTPS访问

[美国访问学者J1]签证的材料准备

vulnhub靶机darkhole

Seal库官方示例（一）：bfv_basics.cpp解析

flutter系列之:在flutter中使用流式布局

真题集P93---2017年计专真题

数据库约束