一、引言
模型部署优化是一个涵盖众多环节的宽泛领域,从模型训练完成到实际硬件部署,涉及多个层面的工作,且每个环节对技术的要求各异。其本质是通过减小模型大小、提高推理速度等手段,使模型能在各种硬件中成功部署并实时有效运行。
二、模型剪枝技术
(一)模型剪枝的定义
深度学习网络中存在大量冗余参数,许多神经元激活值趋近于 0,去除这些冗余后模型仍能保持相同表达能力,此即过参数化,对应的技术就是模型剪枝。
(二)模型剪枝并非新概念
Dropout 和 DropConnect 是经典的类似技术,如 Dropout 随机将神经元输出置零,DropConnect 随机将神经元连接置零,但因仅在训练中操作且不影响最终模型,未被视为模型剪枝技术。
(三)模型剪枝的粒度分类
模型剪枝至少可分为 4 种粒度: