不管是初学者还是精通智能优化算法(粒子群算法，遗传算法等)的朋友，相信你们都对智能优化算法运行之慢深有体会，对于比较复杂的问题，经常出现运行一次几小时，调试一次几小时的情况。调试了这么多年代码，智能优化算法对我来说算是老朋友了，平时也积累了一些提高智能优化算法运行效率的办法，在此分享给大家。

1.基本粒子群算法和matlab实现

这篇博客以粒子群算法为例，说明使用matlab编程时，如何减少粒子群算法运行时间。要解决的目标函数为：

其中，变量x和y都属于[-10,10]的区间，要求出f(x)的最大值。

matlab绘图代码和图像如下：

[x,y]=meshgrid(-1.2:0.01:1.2);
z=sin( sqrt(x.^2+y.^2) )./sqrt(x.^2+y.^2)+exp((cos(2*pi*x)+cos(2*pi*y))/2)-2.71289;
mesh(x,y,z)

从函数图形可以看出，该函数有很多局部极大值点，而极值位置为(0,0)，在(0,0)附近取得极大值。

粒子群算法(particle swarm optimization,PSO)最早由Kennedy和Eberhart在1995年提出的，源于对鸟类捕食行为的研究，算法中每个粒子都代表问题的一个潜在解，每个粒子对应一个由适应度函数决定的适应度值。粒子的速度决定了粒子移动的方向和距离，速度随自身及其他粒子的移动经验进行动态调整，从而实现个体在可解空间中的寻优。

PSO算法首先在可行解空间中初始化一群粒子，每个粒子都代表极值优化问题的一个潜在最优解，用位置、速度和适应度值三项指标表示该粒子特征，适应度值由适应度函数计算得到，其值的好坏表示粒子的优劣。粒子在解空间中运动，通过跟踪个体极值Pbest和群体极值Gbest更新个体位置。个体极值Pbest是指个体所经历位置中计算得到的适应度值最优位置，群体极值Gbest是指种群中的所有粒子搜索到的适应度最优位置。粒子每更新一次位置，就计算一次适应度值，并且通过比较新粒子的适应度值和个体极值、群体极值的适应度值更新个体极值Pbest和群体极值Gbest位置。

实现粒子群算法求解上述优化问题的原始代码如下：

%% 清除变量
clc
clear
close all
warning off

tic
%% 设置种群参数
sizepop = 500;                      % 初始种群个数
dim = 2;                            % 空间维数
ger = 500;                          % 最大迭代次数    
x_max = 10*ones(1,dim);             % 位置上限
x_min = -10*ones(1,dim);            % 位置下限
v_max = 5*ones(1,dim);              % 速度上限
v_min = -5*ones(1,dim);             % 速度下限
w = 0.9;                            % 惯性权重
c_1 = 1.5;                          % 自我学习因子
c_2 = 1.5;                          % 群体学习因子 
%% 种群初始化
pop = x_min + rand(sizepop,dim).*(x_max-x_min);     % 初始化种群
pop_v = v_min + rand(sizepop,dim).*(v_max-v_min);   % 初始化种群速度        
pop_zbest = pop(1,:);                               % 初始化群体最优位置
pop_gbest = pop;                                    % 初始化个体最优位置
fitness = zeros(1,sizepop);                         % 所有个体的适应度
fitness_zbest = -inf;                               % 初始化群体最优适应度
fitness_gbest = -inf*ones(1,sizepop);               % 初始化个体最优适应度
%% 初始的适应度
for k = 1:sizepop
    % 计算适应度值
    fitness(k) = fun(pop(k,:));
    if fitness(k) > fitness_zbest
        fitness_zbest = fitness(k);
        pop_zbest = pop(k,:);
    end
end
history_pso = zeros(1,ger);            % 粒子群历史最优适应度值
%% 迭代求最优解
iter = 1;
while iter <= ger
    for k = 1:sizepop
        % 更新速度并对速度进行边界处理 
        pop_v(k,:)= w * pop_v(k,:) + c_1*rand*(pop_gbest(k,:) - pop(k,:)) + c_2*rand*(pop_zbest - pop(k,:));
        for kk = 1:dim
            if  pop_v(k,kk) > v_max(kk)
                pop_v(k,kk) = v_max(kk);
            end
            if  pop_v(k,kk) < v_min(kk)
                pop_v(k,kk) = v_min(kk);
            end
        end
        % 更新位置并对位置进行边界处理
        pop(k,:) = pop(k,:) + pop_v(k,:);
        for kk = 1:dim
            if  pop(k,kk) > x_max(kk)
                pop(k,kk) = x_max(kk);
            end
            if  pop(k,kk) < x_min(kk)
                pop(k,kk) = x_min(kk);
            end
        end
        % 更新适应度值
        fitness(k) = fun(pop(k,:));
        if fitness(k) > fitness_zbest
            fitness_zbest = fitness(k);
            pop_zbest = pop(k,:);
        end
        if fitness(k) > fitness_gbest(k)
            fitness_gbest(k) = fitness(k);
            pop_gbest(k,:) = pop(k,:);
        end
    end
    history_pso(iter) = fitness_zbest;
%     disp(['PSO第',num2str(iter),'次迭代最优适应度=',num2str(fitness_zbest)])
    iter = iter+1;
end
time0 = toc;
disp(['运行时间为：',num2str(time0) , '秒'])
disp(['最优解：x=',num2str(pop_zbest)])
disp(['最优函数值=',num2str(fitness_zbest)])
% plot(history_pso,'linewidth',1)
% ylabel('最优适应度值')
% xlabel('迭代次数')

function fitness = fun(pop)
x = pop(1);
y = pop(2);
fitness = sin( sqrt(x.^2+y.^2) )./sqrt(x.^2+y.^2)+exp((cos(2*pi*x)+cos(2*pi*y))/2)-2.71289;
end

当种群规模为500，最大迭代次数为500时，粒子群算法某次运行结果如下：

我们可以看到，大约1秒的时间，粒子群算法可以求出最优解为[-1.4828e-9,-5.222e-10]，非常接近最优解[0,0]。

2.该写代码以减少运行时间

其实这份代码在运行时间上还有很大的改进空间，我们可以分块来看。%% 清除变量、%% 设置种群参数与%% 种群初始化这几步基本上都是最优的写法。主要是求适应度和迭代求最优解这里存在循环语句，可以改进写法。

2.1 初始的适应度部分的改写

首先来看%% 初始的适应度这块代码：

%% 初始的适应度
for k = 1:sizepop
    % 计算适应度值
    fitness(k) = fun(pop(k,:));
    if fitness(k) > fitness_zbest
        fitness_zbest = fitness(k);
        pop_zbest = pop(k,:);
    end
end

这里用到的循环语句，运行时间肯定会偏长。那么我们可不可以改写这部分代码，去掉循环语句，同时保持效果不变？当然是可以的，但首先需要改写一下fun函数，初始的fun函数是这样的：

function fitness = fun(pop)
x = pop(1);
y = pop(2);
fitness = sin( sqrt(x.^2+y.^2) )./sqrt(x.^2+y.^2)+exp((cos(2*pi*x)+cos(2*pi*y))/2)-2.71289;
end

由于我们最开始默认传入fun函数的变量pop只代表一个粒子，所以是一个1×2的变量，就可以令x = pop(1)，令y = pop(2)，计算得到的输出变量fitness也是一个1×1的标量。如果输入变量pop是一个n×2的变量，就不能这样写了，需要把fun函数改写成：

function fitness = fun(pop)
x = pop(:,1);
y = pop(:,2);
fitness = sin( sqrt(x.^2+y.^2) )./sqrt(x.^2+y.^2)+exp((cos(2*pi*x)+cos(2*pi*y))/2)-2.71289;
end

这样就可以输入一个n×2的变量pop，输出一个n×1变量fitness，直接计算所有粒子的适应度。同时在主函数部分也需要把代码修改为：

%% 初始的适应度
fitness = fun(pop);                                 % 所有个体的适应度
fitness_gbest = fitness;                            % 初始化个体最优适应度
[fitness_zbest,zbest_index] = max(fitness);
pop_zbest = pop(zbest_index,:);                     % 初始化群体最优位置
history_pso = zeros(1,ger);                         % 粒子群历史最优适应度值

同时也省去了前面初始化的一些代码。

2.2 迭代求最优解部分的改写

再来看迭代求最优解的部分。首先这里也包括了求适应度的部分，可以直接沿用上面的成果。对于速度和位置的更新，还有进一步改进的空间。

    for k = 1:sizepop
        % 更新速度并对速度进行边界处理 
        pop_v(k,:)= w * pop_v(k,:) + c_1*rand*(pop_gbest(k,:) - pop(k,:)) + c_2*rand*(pop_zbest - pop(k,:));
        for kk = 1:dim
            if  pop_v(k,kk) > v_max(kk)
                pop_v(k,kk) = v_max(kk);
            end
            if  pop_v(k,kk) < v_min(kk)
                pop_v(k,kk) = v_min(kk);
            end
        end
        % 更新位置并对位置进行边界处理
        pop(k,:) = pop(k,:) + pop_v(k,:);
        for kk = 1:dim
            if  pop(k,kk) > x_max(kk)
                pop(k,kk) = x_max(kk);
            end
            if  pop(k,kk) < x_min(kk)
                pop(k,kk) = x_min(kk);
            end
        end
    end

这部分速度慢的原因同样也是因为有一个for循环，使用matlab中向量化的运算可以避免使用for循环，同时保持代码的效果不变，具体如下：

    % 更新速度并对速度进行边界处理 
    r1 = rand(sizepop , 1)*ones(1 , dim);
    r2 = rand(sizepop , 1)*ones(1 , dim);
    pop_v = w * pop_v + c_1*r1.*(pop_gbest - pop) + c_2*r2.*(pop_zbest - pop);
    pop_v(pop_v > v_max) = v_max(pop_v > v_max);
    pop_v(pop_v < v_min) = v_min(pop_v < v_min);
    % 更新位置并对位置进行边界处理
    pop = pop + pop_v;
    pop(pop > x_max) = x_max(pop > x_max);
    pop(pop < x_min) = x_min(pop < x_min);
    % 更新适应度值
    fitness = fun(pop); 
    if max(fitness) > fitness_zbest
        [fitness_zbest,zbest_index] = max(fitness);
        pop_zbest = pop(zbest_index,:);
    end
    fitness_gbest(fitness_gbest < fitness) = fitness(fitness_gbest < fitness);
    pop_gbest(fitness_gbest < fitness , :) = pop(fitness_gbest < fitness , :);
    history_pso(iter) = fitness_zbest;

1)速度的更新。在更新速度时，可以采用矢量化的方式。由于对每个粒子都需要生成随机数r1和r2，所以r1和r2的维度应该都是sizepop×1，另外为了可以使用.*运算使r1和pop_v每个元素可以对应相乘，还将其乘上一个全为1的1×dim向量ones(1,dim)。

而对越限速度的处理方式用到了matlab矩阵中的逻辑索引方式，这里不再赘述，具体可以参考官方文档(查找符合条件的数组元素 - MATLAB & Simulink - MathWorks 中国)

2)位置的更新，位置的更新直接使用矩阵加法，对位置越限粒子的处理和速度越限时的处理一致。

3)更新群体所有的适应度的方法和上面提到的一样，而更新群体最优和个体最优时则需要使用到if语句和逻辑索引。

2.3 两份代码运行时间对比

经过我们的处理，除了迭代求最优解，其他所有的循环语句都被消除了，修改后完整的代码如下：

%% 清除变量
clc
clear
close all
warning off

tic
%% 设置种群参数
sizepop = 500;                      % 初始种群个数
dim = 2;                            % 空间维数
ger = 500;                          % 最大迭代次数    
x_max = 10*ones(sizepop,dim);       % 位置上限
x_min = -10*ones(sizepop,dim);      % 位置下限
v_max = 5*ones(sizepop,dim);        % 速度上限
v_min = -5*ones(sizepop,dim);       % 速度下限
w = 0.9;                            % 惯性权重
c_1 = 1.5;                          % 自我学习因子
c_2 = 1.5;                          % 群体学习因子 
%% 种群初始化
pop = x_min + rand(sizepop,dim).*(x_max-x_min);     % 初始化种群
pop_v = v_min + rand(sizepop,dim).*(v_max-v_min);   % 初始化种群速度        
pop_gbest = pop;                                    % 初始化个体最优位置
%% 初始的适应度
fitness = fun(pop);                                 % 所有个体的适应度
fitness_gbest = fitness;                            % 初始化个体最优适应度
[fitness_zbest,zbest_index] = max(fitness);
pop_zbest = pop(zbest_index,:);                     % 初始化群体最优位置
history_pso = zeros(1,ger);                         % 粒子群历史最优适应度值
%% 迭代求最优解
iter = 1;
while iter <= ger
    % 更新速度并对速度进行边界处理 
    r1 = rand(sizepop , 1)*ones(1 , dim);
    r2 = rand(sizepop , 1)*ones(1 , dim);
    pop_v = w * pop_v + c_1*r1.*(pop_gbest - pop) + c_2*r2.*(pop_zbest - pop);
    pop_v(pop_v > v_max) = v_max(pop_v > v_max);
    pop_v(pop_v < v_min) = v_min(pop_v < v_min);
    % 更新位置并对位置进行边界处理
    pop = pop + pop_v;
    pop(pop > x_max) = x_max(pop > x_max);
    pop(pop < x_min) = x_min(pop < x_min);
    % 更新适应度值
    fitness = fun(pop); 
    if max(fitness) > fitness_zbest
        [fitness_zbest,zbest_index] = max(fitness);
        pop_zbest = pop(zbest_index,:);
    end
    fitness_gbest(fitness_gbest < fitness) = fitness(fitness_gbest < fitness);
    pop_gbest(fitness_gbest < fitness , :) = pop(fitness_gbest < fitness , :);
    history_pso(iter) = fitness_zbest;
%     disp(['PSO第',num2str(iter),'次迭代最优适应度=',num2str(fitness_zbest)])
    iter = iter+1;
end
time0 = toc;
disp(['运行时间为：',num2str(time0) , '秒'])
disp(['最优解：x=',num2str(pop_zbest)])
disp(['最优函数值=',num2str(fitness_zbest)])
% plot(history_pso,'linewidth',1)
% ylabel('最优适应度值')
% xlabel('迭代次数')

function fitness = fun(pop)
x = pop(:,1);
y = pop(:,2);
fitness = sin( sqrt(x.^2+y.^2) )./sqrt(x.^2+y.^2)+exp((cos(2*pi*x)+cos(2*pi*y))/2)-2.71289;
end

运行结果：

求出的最优解也很接近实际最优解[0,0]，同时求解时间从接近1秒大幅减小到0.06秒，减小的比例达到了惊人的94%！！

当然，由于粒子群算法是一个随机搜索，时间也具有偶然性，我们多试几次，求平均值，结果如表1所示：

表1 优化前和优化后代码运行时间对比

次数	优化前/秒	优化后/秒
1	0.97273	0.06014
2	0.94861	0.058207
3	1.0526	0.056668
4	0.97083	0.056835
5	1.0751	0.058857
6	0.9547	0.055463
7	0.98452	0.060969
8	1.1933	0.057191
9	0.98235	0.060772
10	1.0497	0.05734
平均值	1.018444	0.0582442