一、使用joblib进行并行计算

作为一个被广泛使用的第三方Python库（譬如scikit-learn项框架中就大量使用joblib进行众多机器学习算法的并行加速），我们可以使用pip install joblib对其进行安装，安装完成后，下面我们来学习一下joblib中有关并行运算的常用方法：

二、使用Parallel与delayed进行并行加速

joblib中实现并行计算只需要使用到其Parallel和delayed方法即可，使用起来非常简单方便

下面我们直接以一个小例子来演示：

joblib实现并行运算的思想是将一组通过循环产生的串行计算子任务，以多进程或多线程的方式进行调度，而我们针对自定义的运算任务需要做的仅仅是将它们封装为函数的形式即可，譬如：

import time
def task_demo1():
    time.sleep(1)
    return time.time()

接着只需要像下面的形式一样，为Parallel()设置相关参数后，衔接循环创建子任务的列表推导过程，其中利用delayed()包裹自定义任务函数，再衔接()传递任务函数所需的参数即可，其中n_jobs参数用于设置并行任务同时执行的worker数量，因此在这个例子中可以看到进度条是按照4个一组递增的，

可以看到最终时间开销也达到了并行加速效果：
在这里插入图片描述
其中可以根据计算任务以及机器CPU核心数具体情况为Parallel()调节参数，核心参数有：

backend：用于设置并行方式，其中多进程方式有’loky’（更稳定）和’multiprocessing’两种可选项，多线程有’threading’一种选项。默认为’loky’
n_jobs：用于设置并行任务同时执行的worker数量，当并行方式为多进程时，n_jobs最多可设置为机器CPU逻辑核心数量，超出亦等价于开启全部核心，你也可以设置为-1来快捷开启全部逻辑核心，若你不希望全部CPU资源均被并行任务占用，则可以设置更小的负数来保留适当的空闲核心，譬如设置为-2则开启全部核心-1个核心，设置为-3则开启全部核心-2个核心

譬如下面的例子，在我这台逻辑核心数为8的机器上，保留两个核心进行并行计算：
在这里插入图片描述

关于并行方式的选择上，由于Python中多线程时全局解释器锁的限制，如果你的任务是计算密集型，则推荐使用默认的多进程方式加速，如果你的任务是IO密集型譬如文件读写、网络请求等，则多线程是更好的方式且可以将n_jobs设置的很大，举个简单的例子，可以看到，通过多线程并行，我们在5秒的时间里完成了1000次请求，远快于单线程17秒请求100次的成绩
在这里插入图片描述
我们可以根据自己实际任务的不同，好好利用joblib来加速你的日常工作。