[疑难杂症2023-007]multiprocessing.Process使用时遇到的几个棘手问题

news2024/10/7 4:23:58

本文由Markdown编辑器编辑完成。

1. 背景

近日,为了解决自己负责的一个组件,在处理大量数据时,由于内存释放不及时,而导致整个组件占用了较高的内存。
这主要是因为目前我们在使用python的一个采用多进程的框架——Celery.
关于Celery的基本用法,我会在后面专门写一篇文章介绍。
由于Celery,是在设置了总的并发量的基础上,动态的创建和回收进程。有一个参数是:worker_max_tasks_per_child, 是为了设置子进程每运行多少个任务,这个子进程就会被系统回收,释放它所占的内存资源,然后再重新perfork出一个新的子进程,来继续处理任务。

当这个参数设置为1时,其实就是每执行一个任务,就回收进程,释放内存。
我所遇到的应用场景时,部分数据需要立刻释放,部分数据,可以相对将这个参数worker_max_tasks_per_child,设置得大一些。
因此,我想到了,那还不如,直接使用multiprocessing.Process(), 来解决这个问题。

因此,线上运行的基本代码,类似:

from multiprocessing import Process

......
if conditionA:
	Process(target=funcA, args=(m,n)).start()
else:
	Celery_task.apply_async()

这样,就可以根据实际的情况,如果是想让程序每跑一个任务,就回收进程和释放内存,就可以走第一个if分支;如果是可以允许多运行一些任务,不要那么频繁的回收和创建子进程,就可以走else分支。

本来以为,这是一个很简单的改动,但当真正测试时,却发现了很多意想不到的问题。

问题如下:
同样的一个任务,如果运用celery的子进程跑,就可以顺利运行完毕。但是用Process().start()运行,任务在运行过程中就会中止。而且,并不会发生任何的报错。即可加try…except块包起来,也没有任何的异常抛出。

2. 解决方案

为了解决Process()内部的进程,执行任务时中断的问题,开始进行逐行debug。后来在debug的过程中,发现了几个问题,同时也向chatgpt寻求帮助,得到了一些回复。这里记录一下。

2.1 importlib的调用位置

首先发现的问题是,多进程从celery切换到Process()时,importlib的使用,会导致程序处理被中断。
importlib, 主要是为了能够动态地导入一些包。因为需要导入的包的名称,可能需要根据函数传入的参数来决定。
debug过程中发现,如果是在Process()的外部,导入相应的包时,可能导致处理中断。而,如果是在Process()的target函数内部,再import相应的模块,则可以正常的工作。
在这里插入图片描述

2.2 与pytorch的兼容问题

使用Process(), 还有可能在使用到pytorch的地方卡住。
因为,有时候为了调用深度学习模型的一些算法,会将算法封装成一个package,来供子进程的任务调用。
通过一些查询,chatgpt给出的一些解释如下:
在这里插入图片描述
对于以上提到的,与pytorch的兼容问题,前两个推荐的解决方案,是将引入multiprocessing.Process()的地方,修改为引入:
torch.multiprocessing来代替。因为这个torch中的multiprocessing, 通过共享内存的方式,已经解决了:python的GIL锁,和不同进程各自复制一份数据时,内存占用过大的问题;
第3个方案,则是在启用多进程的时候,设置一下调用的方法:

torch.multiprocessing.set_start_method('spawn')

这样可以保证每个进程,都会拥有独立的GPU资源。

以上,是这段时间,因为想当然的使用多进程中的Process()时,与原来的代码的一些兼容问题。
为了定位和解决这些问题,也耗费了挺长的时间。

看来,为了如果对于某些东西,一知半解时,最好不要贸然使用。否则,有可能处理它引发的问题的时间,都大于了它带来的收益。因此,必须知己知彼,方能百战不殆。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/842351.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决Map修改key的问题

需求 现在返回json数据带有分页的数据,将返回data属性数据变更为content,数据不变,key发生变化 实现1,源数据比较复杂,组装数据比较麻烦 说明:如果使用这种方式完成需求,需要创建对象&#xff0…

搭建简易syslog日志中转服务器

在某种场景下,无法接入日志审计设备,本文提供一种方式,可通过搭建简易日志中转服务器,收集到该环境下的日志后,再将其导入日志审计设备中。 0x1 开启服务 rsyslog守护进程来自于当前的linux发布版本的预装模块&#x…

【vue】vue基础知识

1、插值表达式&属性绑定 <!--template展示给用户&#xff0c;相当于MVVM模式中的V--> <template><div class"first_div">//插值表达式<p>{{ message }}</p>//这里的参数是从父组件的template里传过来的<p>{{data_1}}</p…

SIP协议之呼叫保持(HOLD)

呼叫保持(HOLD)是SIP协议应用中的一个重要功能&#xff0c;用于实现不挂断电话而达到暂停媒体&#xff08;常见于音频&#xff0c;视频很少用&#xff09;的目的&#xff0c;而解保持操作会恢复通话。 一、保持/解保持实现机制 1.1 保持 保持发起方&#xff08;保持方&#x…

Flutter 自定义view

带进度动画的圆环。没gif&#xff0c;效果大家自行脑补。 继承CustomPainter&#xff0c;paint()方法中拿到canvas&#xff0c;绘制API和android差不多。 import package:flutter/material.dart;class ProgressRingPainter extends CustomPainter {double strokeWidth 20;Col…

2023应急指挥系统总体架构方案 PPT

导读&#xff1a;原文《应急指挥系统总体架构方案PPT》&#xff08;获取来源见文尾&#xff09;&#xff0c;本文精选其中精华及架构部分&#xff0c;逻辑清晰、内容完整&#xff0c;为快速形成售前方案提供参考。 完整版领取方式 完整版领取方式&#xff1a; 如需获取完整的电…

如何找到死锁的线程?_java都学什么

在Java中&#xff0c;死锁是指两个或多个线程被无限地阻塞&#xff0c;等待彼此持有的资源&#xff0c;从而导致程序无法继续执行的情况。死锁通常是由于线程之间循环等待资源而产生的。要找到死锁的线程&#xff0c;可以采用以下方法&#xff1a; 1.线程转储(Thread Dump) 通过…

【Vant Weapp】van-icon 图标

<van-icon name"play-circle" color"rgba(255,255,255,.6)" size"40"/>

关于策略模式的注入问题

上面抄别人的 当在实现策略方法时&#xff0c;报null&#xff0c;排查后发现是接口实现有多个&#xff0c;需要添加别名 注入时添加Qeualifier&#xff0c;指定名称&#xff0c;如下图&#xff1b;如图上修改&#xff0c; 测试类中不用new具体行为策略了&#xff0c;注入别名即…

OpenStreetMap数据转3D场景【Python + PostgreSQL】

很长一段时间以来&#xff0c;我对 GIS 和渲染感兴趣&#xff0c;在分别尝试这两者之后&#xff0c;我决定最终尝试以 3D 方式渲染 OpenStreetMap 中的地理数据&#xff0c;重点关注不超过城市的小规模。 在本文中&#xff0c;我将介绍从建筑形状生成三角形网格、以适合 Blend…

认识Vue;vue使用和安装;声明式和命令式编程;MVVM模型;data属性;methods属性

目录 1_认识Vue2_vue使用和安装3_声明式和命令式编程4_MVVM模型5_data属性6_methods属性 1_认识Vue Vue (读音 /vjuː/&#xff0c;类似于 view) 是一套用于构建用户界面的渐进式 JavaScript框架。 全称是Vue.js或者Vuejs&#xff1b; 它基于标准 HTML、CSS 和 JavaScript 构建…

SpringBoot开发环境热部署

目录 开发热部署 添加dev-tools依赖 在application.properties中配置devtools 在IDEA中添加设置 开发热部署 在实际的项目开发调试过程中会频繁地修改后台类文件&#xff0c;导致需要重新编译、 重新启动&#xff0c;整个过程非常麻烦&#xff0c;影响开发…

密码攻击与ADSelfService Plus的保护

密码攻击是当前网络安全面临的严峻挑战之一。黑客通过不断演进的技术手段&#xff0c;试图入侵用户账户&#xff0c;窃取敏感信息&#xff0c;从而对个人和组织造成严重损害。为了应对密码攻击的威胁&#xff0c;ManageEngine推出了ADSelfService Plus&#xff0c;这是一款功能…

【数据结构】链表(一)

链表&#xff08;一&#xff09; 文章目录 链表&#xff08;一&#xff09;01 引入02 概念及结构03 单向不带头不循环链表实现3.1 创建节点类型3.2 简易创建一个链表3.3 遍历链表每个节点3.4 获取链表长度3.5 查找是否包含关键字key是否在单链表当中3.6 头插法3.7 尾插法3.8 任…

无涯教程-Perl - delete函数

描述 此函数从哈希中删除指定的键和关联的值,或从数组中删除指定的元素。该操作适用于单个元素或切片。 语法 以下是此函数的简单语法- delete LIST返回值 如果键不存在,并且与已删除的哈希键或数组索引关联的值,则此函数返回undef。 Perl 中的 delete函数 - 无涯教程网无…

Java spring boot 全解Camunda 7,从 0 到 1 构建工作流平台——第二节:Spring boot 简单集成

目录 1. 成果展示2. 环境准备3. 项目构建3.1 项目结构3.2 引入Camunda 依赖3.3 启动spring boot 程序3.4 启动 web app 程序 引言&#xff1a;当今技术发展迅猛&#xff0c;企业对于业务流程的高效管理和自动化需求也日益增长。在这个背景下&#xff0c;Spring Boot和Camunda7成…

【网络基础实战之路】基于MGRE多点协议的实战详解

系列文章传送门&#xff1a; 【网络基础实战之路】设计网络划分的实战详解 【网络基础实战之路】一文弄懂TCP的三次握手与四次断开 【网络基础实战之路】基于MGRE多点协议的实战详解 【网络基础实战之路】基于OSPF协议建立两个MGRE网络的实验详解 PS&#xff1a;本要求基于…

Jupyter Notebook 未授权访问远程命令执行漏洞

漏洞描述 Jupyter是一个开源的交互式计算环境&#xff0c;它支持多种编程语言&#xff0c;包括Python、R、Julia等。Jupyter的名称来源于三种编程语言的缩写&#xff1a;Ju(lia)、Py(thon)和R。 Jupyter的主要特点是它以笔记本&#xff08;Notebook&#xff09;的形式组织代码…

Python基础教程——贪吃蛇、连连看小游戏(完整版,附源码)

一、贪吃蛇 1. 案例介绍 贪吃蛇是一款经典的益智游戏&#xff0c;简单又耐玩。该游戏通过控制蛇头方向吃蛋&#xff0c;从而使得蛇变得越来越长。 通过上下左右方向键控制蛇的方向&#xff0c;寻找吃的东西&#xff0c;每吃一口就能得到一定的积分&#xff0c;而且蛇的身子会…

pointpillars在Ubuntu2004训练的总结

1、找到pointpcdet-master之后在此打开终端输入code进入VScode界面 code 2、激活pp环境 conda activate pp 3、cd进入tools cd tools 4、将kitti数据集准备好放入data路径下之后开始训练 python train.py --cfg_file cfgs/kitti_models/pointpillar.yaml 5、训练完成之…