1.论文整体框架概述
在行人重识别任务中,通常都是对整个输入数据进行特征提取,但是缺少了局部信息。能不能既考虑局部与整体信息,也同时加入他们的联系呢?这篇论文主要的思想就是局部信息和全局信息的融合。
整体流程如上图所示,
- 首先对整体进行特征提取, 通常采用图像分类网络(如resnet50)进行特征提取,获得特征图
-
然后将特征图分块,这篇论文中直接在h维度进行截取分块,并没有利用其它辅助信息。可以理解为将人分为不同的局部区域
-
然后就是整个论文的核心部分,GCP模块提取得到全局特征,One-vs-Rest获得局部特征。对于全局特征的获取, Maxpool提取到的是整体全局的特征,avgPool代表的是分散的局部特征的平均,会引入局部与背景信息。为了消除干扰,使用Avgpool-MaxPool即得到了分散的局部特征与全局特征的差异程度(关系),然后使用卷积层去学习这种关系,并与Maxpool经过卷积的全局特征进行拼接,使用卷积提取出全局特征。但是作者并未给出