1. NCNN的Conv量化计算流程 正常的fp32计算中,一个Conv的计算流程如下: 在NCNN Conv进行Int8计算时,计算流程如下: NCNN首先将输入(bottom_blob)和权重(weight_blob)量化成INT8,在INT8下计算卷积,然后反量化到fp32,再和未量化的bias相加,得到输出(top_blob) 输入和权重的量化公式: 由于weight_blob(int8)和bottom_blob(int8)是相乘的: 反量化的目的是将int8映射回原来的fp32,范围要保持一致;所以为了实现一个反映射,量化反量化的scale应该为: