一、简述
GIST描述符是一种用于场景识别的全局图像特征,它能够有效地描述图像的空间结构信息。GIST描述符最初是在这篇论文中提出的:A Computational Approach to Edge Detection 1998。
图像的 GIST 描述符可以通过分析空间频率和方向来捕获。直观上,GIST 总结了图像不同部分的梯度信息(比例和方向),提供了场景的粗略描述。
主要的思想是:
1、计算滤波器响应(Gabor滤波器的滤波器组)
2、将图像补丁划分为4 x 4个单元格
3、计算每个小区的滤波器响应平均值
4、描述符的大小为4 x 4 x N,其中N是滤波器组的大小
GIST描述符关注场景本身的形状,关注表面轮廓与其属性之间的关系,忽略场景中的局部对象及其关系。定义了场景结构的表示,称为空间包络,以及它的五个感知属性:自然性、开放性、粗糙性、扩展性和粗糙性,这对人类观察者来说是有意义的。这些性质的程度可以使用各种技术来检查,例如傅立叶变换和PCA。利用一种称为窗口判别谱模板(WDST)的函数来描述不同空间位置的谱分量对空间包络特性的贡献,并在学习阶段获得其参数。
它是一个低维、紧凑的特征表达,也可以看作是图像的全局特徵模板。GIST描述符经常和分类方法如SVM结合使用,实现图像的场景分类。它对照明变化和位置平移不太敏感,可以保持场景类别的一致性。
<