深度学习系列70：模型部署torchserve

news2026/2/11 11:44:05

1. 流程说明

ts文件夹下，
从launcher.py进入，执行jar文件。
入口为model_server.py的start()函数。内容包含：

读取args，创建pid文件
找到java，启动model-server.jar程序，同时读取log-config文件，TEMP文件夹地址，TS_CONFIG_FILE文件
根据cpu核数、gpu个数，启动多进程。每个进程有一个socket_name和socket_type，执行model_service_worker.py，创建TorchModelServiceWorker类，并执行run_server方法。run_server不断执行handle_connection方法，handle_connection不断执行predict(cmd为I时)或者load_model（cmd为L时）任务。
load_model可以返回service对象，而service可以执行predict函数。如果handler中间包含冒号，则用后面的function作为_entry_point，否则默认用handle函数作为_entry_point。
service的定义如下。其中manifest是一个字典，记录在MAR包里面的MAR_INF/MANIFEST.json中，包含modelName，serializedFile，handler，modelVersion等信息。这些信息也是modelArchiver打包模型时需要的内容。

class Service(object):
    """
    Wrapper for custom entry_point
    """

    def __init__(
        self,
        model_name,
        model_dir,
        manifest,
        entry_point,
        gpu,
        batch_size,
        limit_max_image_pixels=True,
        metrics_cache=None,
    ):

接下来看一下predict函数。首先是调用retrieve_data_for_inference方法获取input_batch，其格式为{parameter["name"]: parameter["value"]}。然后是调用ret = self._entry_point(input_batch, self.context)，这里的_entry_point就是我们自己定义的handler.handle方法。默认的handle方法执行三步：

data_preprocess = self.preprocess(data)
output = self.inference(data_preprocess)
output = self.postprocess(output)

2. 运行

首先安装java，然后pip install torchserve torch-model-archiver
接着将模型和参数打包：torch-model-archiver --model-name test --version 1.0 --serialized-file test.torchscript.pt --handler handler_test.py --export-path model_store
启动服务torchserve --start --ncs --model-store model_store --models test.mar --disable-token-auth --ts-config config.properties
停止服务torchserve --stop
调用：

res = requests.post("http://127.0.0.1:8080/predictions/test",files = {"data":data})

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1949752.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

深度学习系列70：模型部署torchserve

1. 流程说明

2. 运行

相关文章

服务器数据恢复—raid信息丢失导致RAID无法被识别的数据恢复案例

Python 文件及目录操作指南

WAF+API安全代表厂商｜瑞数信息入选IDC报告《生成式AI推动下的中国网络安全硬件市场现状及技术发展趋势》

电脑屏幕录制软件哪个好？推荐3款，满足各种录制需求

IEC104转MQTT网关支持将IEC104数据转换为华为云平台可识别的格式

WPF MVVM框架：CommunityToolkit.Mvvm包使用介绍

Centos安装、迁移gitlab

Idea如何查看Maven依赖树

Linux中MySQL 双主复制(互为主从)配置指南(详细过程)！

stats 监控 macOS 系统

[Unity] ShaderGraph实现DeBuff污染溶解叠加效果

分布式事务（典型的分布式事务场景+CAP+解决方案）

【React】详解样式控制：从基础到进阶应用的全面指南

基于JSP、java、Tomcat、mysql三层交互的项目实战--校园交易网（1）-项目搭建（前期准备工作）

【数据结构】顺序表（杨辉三角、简单的洗牌算法）

【机器学习】GPT LoRA：大模型微调的艺术与效率

ansible基础讲解和加密文件讲解

【Android】Activity与Fragment的数据传递

优化医疗数据管理：Kettle ETL 数据采集方案详解

【Gitlab】SSH配置和克隆仓库