Python 的多进程与多线程是并发编程的两种重要方式,用于提高程序的执行效率。它们各自有不同的特点和适用场景。
多进程(Multiprocessing)
概念:
多进程是指操作系统中同时运行多个程序实例,每个实例称为一个进程。每个进程都拥有独立的内存空间和系统资源。
特点:
- 独立性:每个进程拥有独立的内存地址空间,互不干扰。
- 稳定性:一个进程的崩溃不会影响其他进程的运行。
- 资源消耗:创建和切换进程的开销较大,因为需要为每个进程分配内存和其他系统资源。
- 数据共享:进程间通信(IPC)需要通过特定的机制来实现,如管道、消息队列、共享内存等。
适用场景:
- CPU 密集型任务,即计算密集型任务,适合使用多进程,因为可以利用多核 CPU 的并行计算能力。
- 需要高稳定性的场景,如服务器后端,一个进程的崩溃不会导致整个服务停止。
代码实现:
1.导包
2.创建进程对象
3.启动进程执行任务
源码:
import os
import time
import multiprocessing as m
def sing(num, name):
print('子进程id', os.getpid())
print('子进程的父id', os.getppid())
for i in range(num):
print('%s唱歌...%d次' % (name, i + 1))
time.sleep(0.5)
def dance(num, name):
for i in range(num):
print(f'{name}跳舞...')
time.sleep(0.5)
if __name__ == '__main__':
"""
target:指定执行函数名
args:使用元组传参
kwargs:使用字典传参
"""
print('主进程id', os.getppid())
p = m.Process(target=sing, args=(3, '小明'))
# 设置守护主进程,主进程结束,子进程不再执行
p.daemon = True
p2 = m.Process(target=dance, kwargs={'num': 2, 'name': '小红'})
p.start()
p2.start()
多线程(Multithreading)
概念:
多线程是指在同一个进程中并发执行多个线程,共享进程的内存空间和系统资源。
特点:
- 共享性:线程间共享进程的内存空间和系统资源。
- 开销小:创建和切换线程的开销通常比进程小。
- 全局解释器锁(GIL):在 CPython 解释器中,由于全局解释器锁(GIL)的存在,多线程在 CPU 密集型任务中并不能实现真正的并行执行,只能实现并发。但在 I/O 密集型任务中,多线程可以有效提高程序的响应速度。
- 数据同步:多线程间共享数据可能导致数据不一致,因此需要使用锁、条件变量等同步机制来确保数据的正确性。
适用场景:
- I/O 密集型任务,如网络请求、文件读写等,多线程可以提高程序的响应速度和吞吐量。
- 需要共享数据的场景,多线程可以方便地访问和修改共享数据。
代码实现:
1.导包
2.创建线程对象
3.启动线程执行任务
源码:
import threading
import time
def sing(num):
for i in range(num):
print('唱歌...')
time.sleep(0.2)
def dance(num):
for i in range(num):
print('跳舞...')
time.sleep(0.2)
if __name__ == '__main__':
t1 = threading.Thread(target=sing,args=(3,),daemon=True)
t2 = threading.Thread(target=dance,kwargs={'num':5})
t1.start()
t2.start()
总结
多进程和多线程各有优劣,选择哪种方式取决于具体的应用场景和需求。对于 CPU 密集型任务,通常使用多进程;对于 I/O 密集型任务或需要共享数据的场景,多线程可能更合适。在实际开发中,还可以考虑使用进程池和线程池来管理和控制并发数量,以提高系统的稳定性和性能。