【Docker】【深度学习算法】在Docker中使用gunicorn启动多个并行算法服务,优化算法服务:从单进程到并行化

news2024/11/26 22:48:59

文章目录

      • 优化算法服务:从单进程到并行化
        • 单个服务架构
        • 多并行服务架构
        • Docker化并指定并行服务数量
  • 扩展知识

优化算法服务:从单进程到并行化

在实际应用中,单个算法服务的并发能力可能无法满足需求。为了提高性能和并发处理能力,我们可以使用Gunicorn和Docker来实现算法服务的并行化部署。

单个服务架构

首先,让我们来看看单个服务的架构:

from fastapi import FastAPI

app = FastAPI()

alg_model = xxxx()  # Initialize your algorithm model

@app.post("/alginfer")
def alginfer(xxxx):
    # Perform inference using alg_model
    result = alg_model.predict(xxxx)
    return result

在这个架构下,服务拓扑图如下:

单个服务拓扑图

多并行服务架构

为了提高服务并发能力,我们可以使用Gunicorn来启动多个并行的算法服务。以下是如何使用Gunicorn进行多并行服务的部署:

pip install gunicorn 
gunicorn -w 2 -b 0.0.0.0:7860 -k uvicorn.workers.UvicornWorker sdxl_app:app

在这个架构下,服务拓扑图变为:

多个并行服务拓扑图

Docker化并指定并行服务数量

通过Docker容器化算法服务,并通过环境变量来指定并行服务的数量,可以进一步简化部署和管理。以下是实现这一目标的步骤:

首先,创建一个gunicorn_config.py文件:

import os

bind = '0.0.0.0:7860'  # Listen address and port
workers = int(os.environ.get('GUNICORN_WORKERS', '1'))  # Number of workers
worker_class = 'uvicorn.workers.UvicornWorker'  # Worker type

然后,编写Dockerfile:

FROM kevinchina/xxxx:xxxx
EXPOSE 7860
ENTRYPOINT gunicorn -c /workspace/gunicorn_config.py sdxl_app:app

最后,通过docker run命令启动容器,并指定环境变量来设置并行服务的数量:

docker run -e GUNICORN_WORKERS=2 -p 7860:7860 -d --gpus all kevinchina/xxxx:tttt

通过这些优化,我们可以轻松地实现算法服务的并行化部署,提高系统的性能和可伸缩性。

扩展知识

当你使用 Gunicorn 启动服务时,-k 参数用于指定使用的 worker 类型。不同的 worker 类型适用于不同的场景和需求。以下是一些常见的 worker 类型以及它们的用途:

  • sync:同步 worker,每个请求都会在一个独立的线程或进程中处理。适用于开发环境或者对并发要求不高的场景。
  • eventlet:基于事件驱动的并发库,可以实现高并发。适用于 I/O 密集型的应用程序。
  • gevent:基于 libev 的并发库,也是事件驱动的。与 eventlet 类似,适用于 I/O 密集型的应用程序。
  • uvicorn.workers.UvicornWorker:使用 Uvicorn worker,适用于 ASGI 应用程序。

你可以根据你的应用程序类型和需求选择合适的 worker 类型。例如,如果你的应用程序是基于 ASGI 的,你可以使用 Uvicorn worker。以下是一个使用 -k 参数指定 worker 类型的示例:

gunicorn -w 4 -b 0.0.0.0:7860 -k uvicorn.workers.UvicornWorker sdxl_app:app

在这个示例中:

  • -w 4 指定了 4 个 worker 进程。
  • -b 0.0.0.0:7860 指定了绑定的主机和端口。
  • -k uvicorn.workers.UvicornWorker 指定了使用 Uvicorn worker。

根据你的实际情况选择适合的 worker 类型,并根据需要调整其他参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1426051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL基础(三)-学习笔记

一.innodb引擎: 1). 表空间:表空间是InnoDB存储引擎逻辑结构的最高层,启用了参数 innodb_file_per_table(在 8.0版本中默认开启) ,则每张表都会有一个表空间(xxx.ibd),一个mysql实例可以对应多个…

figure方法详解之清除图形内容

figure方法详解之清除图形内容 一 clf():二 clear():三 clear()方法和clf()方法的区别: 前言 Hello 大家好!我是甜美的江。 在数据可视化中,Matplotlib 是一个功能强大且广泛使用的库,它提供了各种方法来创建高质量的图形。在 Mat…

p2Cache: Exploring Tiered Memory for In-Kernel File Systems Caching——论文泛读

ATC 2023 Paper 分布式元数据论文汇总 问题 快速、字节寻址的持久性内存(PM)正在产品中变得越来越现实。然而,使传统的内核文件系统完全支持PM需要大量的工作,面临着在块级访问粒度和字节寻址之间转换的挑战。此外,新…

react 之 react.memo

React.memo 作用:允许组件在props没有改变的情况下跳过重新渲染 组件默认的渲染机制 默认机制:顶层组件发生重新渲染,这个组件树的子级组件都会被重新渲染 // memo // 作用:允许组件在props没有改变的情况下跳过重新渲染import…

UGUI中Text和TextMeshPro实现图文混排方式

一些项目中实现图文混排是自定义一个脚本去继承Text类,然后文本中用富文本的方式进行图片和超链接的定义,在代码中用正则表达式匹配的方式把文本中图片和超链接给替换,如下: TextMeshPro实现是生成SpriteAsset进行图文混排的&…

SpringCloud + Nacos配置文件加载顺序和优先级详解

文章目录 一、加载顺序与优先级1. 示例配置2. 配置文件分类3. 加载顺序4. 优先级 二、本地配置优先的设置结论 在微服务架构中,合理地管理和理解配置文件的加载顺序与优先级对于确保应用的稳定性和灵活性至关重要。特别是在使用 Spring Cloud Alibaba Nacos 作为配置…

数组与字符串深度巩固

经过再三思考觉得今天就写一篇关于数组与字符串相关的文章吧!其中字符串主要通过练习来巩固知识亦或是获得新知识。好接下来将进行我们的学习时刻了。 首先我们来思考一个问题,你真的了解数组的数组名吗?数组名真的就单单一个名字而已吗&…

nodejs+vue+mysql校园失物招领网站38tp1

本高校失物招领平台是为了提高用户查阅信息的效率和管理人员管理信息的工作效率,可以快速存储大量数据,还有信息检索功能,这大大的满足了用户和管理员这两者的需求。操作简单易懂,合理分析各个模块的功能,尽可能优化界…

【unity小技巧】unity3d创建和实现破碎打破物品,万物可破碎

文章目录 破碎插件可破碎的物品代码控制加入破坏力完结 破碎插件 关于物品破碎,其实之前已经分享过一个免费插件,如果没有碎片化的模型,可以选择使用这个插件: OpenFracture插件实现unity3d物体破裂和切割 可破碎的物品 代码控制…

zsh: command not found: mysql (mac通过安装MySQL后终端cmd找不到mysql命令)

考虑是mysql环境变量没有配置的问题 1.查找mysql安装路径 ps -ef|grep mysql 2.先启动上安装的mysql 3. 查看 .bash_profile 文件 ls -al 查看是否有(.bash_profile)文件 如果没有就输入以下命令创建一个,再查看 touch .bash_profile 4.打开 .bash_profile 文件 …

Spring的事件监听机制

这里写自定义目录标题 1. 概述(重点)2. ApplicationEventMulticaster2.1 SimpleApplicationEventMulticaster2.2 AbstractApplicationEventMulticaster 3. ApplicationListener3.1 注册监听器3.2 自定义 4. SpringApplicationRunListeners 1. 概述&#…

气膜厂家产品种类繁多,哪种适合您?

气膜是一种以薄膜为材料、通过气体充气而形成的充气结构。由于其轻便、灵活、耐用等优点,在各个领域都有广泛应用。气膜厂家生产的产品种类繁多,下面将介绍几种常见的气膜产品,并分析哪种适合您。 气膜建筑是气膜厂家的特色产品之一。气膜建…

探析零知识证明高能发展路径:走向更安全、私密且可扩展的 Web3 新时代

原文:https://www.coinbase.com/blog/understanding-the-zero-knowledge-landscape 作者:Jonathan King|Coinbase Ventures 编译:TinTinLand 本文核心观点 2023 年,零知识技术吸引了逾 4 亿美元的投资,主…

凝聚共识开新篇:产业“围炉谈”共促5G-A加速

由北京通信学会主办的“新阶段、新体验、新价值”产业围炉谈活动在北京时间1月25日已成功举办。 来自社会各界的专家代表齐聚一堂,围炉畅谈5G-A产业发展,共同呼吁5G-A产业加速,擘画数字发展新画卷。 承前启后,5G-A开启5G新阶段 …

MySQL索引的原理和SQL优化策略

1. 索引 在InnoDB存储引擎中,索引分为聚簇索引和辅助索引两种类型。 聚簇索引是指基于表的主键构建的索引,它决定了表中数据的物理存储顺序。也就是说,聚簇索引中的键值按照主键的顺序来排序,并且每个叶子节点存储的是整个表行的…

VBA技术资料MF113:将文件夹图像添加到PowerPoint

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。我的教程一共九套,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到…

小程序跳转:云开发之h5跳小程序

背景: 抖音通过链接跳转微信小程序。考虑使用h5页面中转实现,下面是实现步骤。 官方的文档上面写的还是比较详细的,可以仔细阅读,按照步骤去操作。 实践总结: 测试必须使用真机测试,模拟器之类的全部不…

Spring实现事务(一)

Spring事务 .什么是事务事务的操作Spring中事务的实现准备工作创建表创建项目,引入Spring Web, Mybatis, mysql等依赖配置文件实体类 编程式事务(手动写代码操作事务)声明式事务(利用注解自动开启和提交事务) . 什么是事务 事务是⼀组操作的集合, 是⼀个不可分割的操作 在我们…

P9809 [SHOI2006] 作业 Homework 浅显易懂讲解这道题为什么根号分治

题目: 我们有一堆数,找出模Y的最小值。 思路: 我们初步思考,会发现每个Y是一段,比如 1~Y , Y~2Y , 2Y~3Y ... 每个区间都可能有最小的答案。 这里对Y可以使用根号分治,因为: 当Y足够大时&a…

MySQL原理(一)架构组成之物理文件组成

目录 一、日志文件 1、错误日志 Error Log 1.1、作用: 1.2、开启关闭: 1.3、使用 2、二进制日志 Binary Log & Binary Log Index 2.1、作用: 2.2、开启关闭: 2.3、Binlog还有一些附加选项参数 (1&#x…