模型剪枝综述

1 深度神经网络的稀疏性：

2 剪枝算法分类：

3 具体的剪枝方法包括：

4 剪枝算法流程：

5 几种常见的剪枝算法：

6 结构化剪枝和非结构化剪枝各有其优缺点：

7 剪枝算法对模型精度的影响

8 影响剪枝算法对模型精度的因素

模型压缩中的剪枝算法是一种应用广泛的模型压缩方法，其通过剔除模型中“不重要”的权重，来减少模型的参数量和计算量，同时尽量保证模型的精度不受影响。

模型剪枝的核心是模型中的权重、激活、梯度等是稀疏的，减少部分参数不会影响模型的性能和泛化能力。

1 深度神经网络的稀疏性：

权重稀疏：在大多数神经网络中，权重数值的分布接近正态分布，越接近0的权重越多。通常认为权重数值的绝对值大小可作为重要性的一种度量，数值越大对模型输出贡献越大，反之则不重要，删去后对模型精度影响较小，但仍需再训练模型以恢复精度。
激活稀疏：ReLU 激活函数会使负半轴的输入产生0值的输出，此外，max_pooling 池化操作也会产生类似稀疏的效果，即无论网络接收到什么输入，大型网络中很大一部分神经元的输出大多为零。

2 剪枝算法分类：

结构化剪枝：改变网络中的滤波器组和特征通道数目，所获得的模型不需要专门的算法和硬件就能运行。可进一步细分，如 channel-wise、filter-wise 或 shape-wise 等。
非结构化剪枝：对连接或者神经元进行剪枝，能实现更高的压缩率并保持较高的模型性能，但会带来网络模型稀疏化，其稀疏结构对于硬件加速计算并不友好，除非底层硬件和计算加速库对稀疏计算有较好的支持，否则剪枝后很难获得实质的性能提升。

3 具体的剪枝方法包括：

细粒度剪枝（fine-grained）：粒度最小的剪枝，如随机将一些神经元的输出置零的 dropout，以及随机将部分神经元间的连接置零的 dropconnect 都属于细粒度剪枝。
向量剪枝（vector-level）：对卷积核内部（intra-kernel）进行剪枝，粒度稍大于细粒度剪枝。
核剪枝（kernel-level）：去除某个卷积核，丢弃对输入通道中对应卷积核的计算。
滤波器剪枝（filter-level）：对整个卷积核组进行剪枝，推理过程中输出特征通道数会改变。

4 剪枝算法流程：

目前剪枝算法的总体流程可归结为以下三种：

标准剪枝算法流程：主要包含训练、剪枝以及微调三个部分。首先对网络模型进行预训练，获得在特定基础任务上训练好的原始模型；然后进行如细粒度剪枝、向量剪枝、核剪枝、滤波器剪枝等操作，并对网络模型结构进行评估，确定需要剪枝的层，设定裁剪阈值或比例，通过加入 mask 矩阵来实现剪枝；最后进行微调，以恢复被剪枝操作影响的模型表达能力。微调时参数在计算时先乘以 mask，mask 为 1 的参数值可继续训练通过 BP 调整梯度，而 mask 为 0 的部分则不对后续部分产生影响。之后还可进行再剪枝，将微调后的网络模型再次进行模型结构评估和执行剪枝算法，不断迭代优化，直到满足剪枝目标需求。
基于子模型采样的剪枝流程：得到训练好的模型后，对可修剪的网络结构按照剪枝目标进行采样（采样过程可以是随机的，也可按照网络结构的重要性或通过 KL 散度计算进行概率采样），得到采样子模型。通常进行多次采样，得到多个子模型，之后对每个子模型进行性能评估，选取最优的子模型进行微调得到最后的剪枝模型。
基于搜索的剪枝流程：主要依靠强化学习等无监督学习或半监督学习算法，或神经网络结构搜索相关理论。给定剪枝目标后，在网络结构中搜索较优的子结构，此搜索过程往往伴随着网络参数的学习过程，因此部分基于搜索的剪枝算法在剪枝结束后不需要再进行微调。

剪枝算法的发展趋势包括打破固定假设、走向自动化以及与 NAS（神经网络架构搜索）融合等。例如挑战已有的固有假设，将部分工作自动化，以及 NAS 中有针对结构化剪枝进行搜索的方法等。

5 几种常见的剪枝算法：

以下是一些常见的剪枝算法：

α-β剪枝（alpha-beta pruning） ：这是对极小化-极大化算法的改进，用于减少博弈树搜索的节点数量，从而提高搜索效率，适用于博弈树的最小最大搜索过程。它通过设定下限α和上限β，记录搜索过程中得到的最优解的取值范围。在搜索过程中，当某个节点的取值范围超出了α和β的范围时，就可以剪枝，停止对该节点的搜索；
极小化-极大化算法（minimax algorithm） ：一种博弈树搜索算法，用于决策博弈过程中的最佳走法。该算法假设两个对手在博弈中都会采取最优策略，因此在搜索博弈树时，它会交替地考虑最大化自己的利益和最小化对手的利益。在每一层，算法会选择最大化自己利益的节点或最小化对手利益的节点，直到达到叶子节点，然后根据叶子节点的估值来进行决策。该算法适用于零和博弈，即一方获利就意味着另一方损失；
启发式剪枝（heuristic pruning） ：利用启发性信息来判断节点是否值得继续搜索。根据启发性信息，评估某个节点的潜在价值，如果该节点的价值低于阈值，则可以进行剪枝，停止对该节点的搜索；
约束剪枝（constraint pruning） ：在满足某种预定约束的情况下，可以直接进行剪枝。例如，在搜索排列组合时，若剩余的元素数量已经无法满足目标要求，就可以直接剪掉该分支；
子问题剪枝（subproblem pruning） ：在动态规划等问题中，利用子问题的最优解来剪枝。如果当前子问题的最优解已经计算出来，并且该最优解无法改进，则可以直接剪枝，避免重复计算；
双向剪枝（bidirectional pruning） ：在某些问题中，可以从问题的两个方向同时进行搜索。在搜索过程中，利用对称性或问题的特殊性质，可以剪掉对称的或重复的分支，从而减少搜索空间；
排序剪枝（sorting pruning） ：在搜索过程中，对搜索的待选节点进行排序，优先搜索那些更有可能满足条件的节点。通过先搜索可能更优的节点，可以尽早地找到最优解，从而剪去无需再搜索的分支；
动态剪枝（dynamic pruning） ：在搜索过程中，根据当前搜索状态和之前搜索的结果，动态地调整剪枝策略。可以基于实时信息来决定是否继续搜索，从而提高搜索效率。