文章目录
- 全局自注意机制
- Permutation Invariant
- MLP扩展比
- AP、mAP、FLOPs、FPS、Top1、mIoU
- AP (平均精度):
- mAP (平均精度均值):
- FLOPs (浮点运算数):
- FPS (每秒帧数):
- Top1 (前1精度):
- mIoU (平均交并比):
- Precision、Recall、F1 score
全局自注意机制
尽管具有较强的远程上下文建模能力,原始的全局自注意机制的计算复杂度与特征图大小成二次关系,计算效率低下,因此,对于以高分辨率特征图为输入的视觉任务,如目标检测和分割,将会带来巨大的计算成本
Permutation Invariant
Permutation Invariant指的是特征之间没有空间位置关系,例如多层感知机,改变像素的位置对最后的结果没有影响
MLP扩展比
MLP的扩展比通常是指多层感知器(MLP)模型中隐藏层的扩展比例。扩展比是隐藏层的神经元数量与输入层神经元数量之间的比率,这个比例可以影响模型的容量和复杂度,通常会影响模型的性能和训练速度。通常情况下,较大的扩展比可以增加模型的容量,但也可能增加训练时间和需要的数据量
AP、mAP、FLOPs、FPS、Top1、mIoU
AP (平均精度):
AP 是指在目标检测任务中,针对每个类别计算的精度,然后求取这些精度的平均值。它用来评估模型在不同类别上的性能
mAP (平均精度均值):
mAP 是所有类别的 AP 的平均值。通常用来表示整个目标检测模型的性能
FLOPs (浮点运算数):
FLOPs 衡量了神经网络模型中的浮点数运算数量。它可以用来估算模型的计算复杂度
FPS (每秒帧数):
FPS 是指模型处理视频流或图像序列时的帧率,即每秒处理的帧数。它用来评估模型的实时性能
Top1 (前1精度):
Top1 指的是分类任务中,模型的最高预测精度。通常以百分比表示,表示模型在其最高置信度的类别上的正确分类率
mIoU (平均交并比):
mIoU 是语义分割任务中的一个性能指标,用于衡量模型对像素级别的分割准确性。它计算所有类别的交并比的平均值
Precision、Recall、F1 score
precision是预测正类的精度
recall 是实际的召回率
F1分数是一个结合了精确率和召回率的指标,可以用来综合评估分类模型的性能
F1分数 = 2 * (精确率 * 召回率) / (精确率 + 召回率)